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(57) Abstract 



The invention concerns a novel nucleic sequence and deduced protein sequence family with whole or partial human endogenous 
retroviral motifs. The invention also concerns the detection and/or the use of said nucleic sequences and said corresponding protein 
sequences or fragments of said sequences, for diagnostic, prophylactic and therapeutic uses, in particular for neuropathological conditions 
with autoimmune constituent such as multiple sclerosis. Said purified nucleic acid sequences comprise all or part of a sequence coding for 
a human endogenous retroviral sequence having at least tfnv-type retroviral motifs, corresponding to the sequence SEQ ID NO: 1 or to a 
sequence having a homology level with said sequence SEQ ID NO:l not less than 80 % on more than 190 nucleotides or not less than 70 
% on more than 600 nucleotides for cnv-type domains. The invention further concerns the use of the flanking or adjacent sequences of 
said sequences and controlled by the latter, as diagnostic reagents. 



(57) Abrege 

Nouvelle familte de sequences nucl&ques et de sequences proteiques deduites, qui prescntent des motifs r6troviraux endog6nes 
humains complete ou partiels. Detection et/ou utilisation desdites sequences nucleiques et desdites sdquences proteiques correspondantes 
ou de fragments de ces sequences, dans le cadre d'applications diagnostiques, prophylactiques et thdrapeutiques, en particulier pour des 
neuropathologies a composante autoimmune comme la sclerose en plaques. Lesdites sequences d'acide nuclcique purifid comprennent tout 
ou partie d*une sequence codant pour une sequence retrovirale endogene humaine, qui presente au moins des motifs retroviraux de type 
env, repondant a la sequence SEQ ID NO: 1 ou a une sequence presentant un niveau d'homotogie avec ladite sequence SEQ ID NO: 1 
superieur ou egal a 80 % sur plus de 190 nucleotides ou supeneur ou egal a 70 % sur plus de 600 nucleotides pour les domaines de type 
env. Utilisation des sequences fianquantes ou adjacentes desdites sequences et contrdlees par ces demieres, comme reactifs de diagnostic. 
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FAMILLE DE SEQUENCES NUCLEIQUES ET DE SEQUENCES PROTEIQUES DEDUTTES PRESENT ANT DES MOTIFS 
RETROVIRAUX ENDOGENES HUM A INS, ET LEURS APPLICATIONS 

5 La presente invention est relative a une . nouvelle famille de 

sequences nucleiques et de sequences proteiques deduites. qui presentent des motifs 
retroviraux endogenes humains complets ou paniels. ainsi que des sequences 
flanquantes ou adjacentes desdites sequences, et controlees par ces demieres : modifi- 
cation de Texpression ou alteration de la structure (polyadenylation. epissage alter- 

10 natif...) desdites sequences flanquantes. 

L'invention est egalement relative a la detection et/ou a Tutilisation 
desdites sequences nucleiques et desdites sequences proteiques correspondantes. dans 
le cadre duplications diagnostiques, prophylactiques et therapeutiques, en paniculier 
pour des neuropathologies a composante autoimmune comme la sclerose en plaques. 

15 L'invention conceme aussi l'obtention de sondes nucleiques double 

brins et simple brin anti-sens, de ribozymes, aptes a moduler la replication virale (T.R. 
Cech, Science, 1987, 236, 1532-1539 ; R.H. Symons. Trends Biochem. &/., 1989. 14, 
445-450) des molecules recombinantes correspondantes, et des anticorps associes. 

Les retrovirus sont des virus qui se repliquent uniquement en utili- 

20 sant la voie inverse du traitement classique de Finformarion genetique. Ce processus, 
nomme transcription inverse, est medie par une ADN polymerase ARN dependante ou 
transcriptase reverse, codee par le gene poL Les retrovirus codent aussi au minimum 
pour deux genes additionnels. Le gene gag code pour les proteines du squelette. ma- 
trice, nucleocapside et capside. Le gene env code pour les glycoproteins d'enveloppe. 

25 La transcription retrovirale est rtgulee par des regions promotrices ou " enhancers 
situees dans des regions hautement repetees ou LTR {Long Terminal Repeat) et qui 
sont presentes aux deux extremites du genome retroviral. 

Lors de Tinfection d'une cellule, la polymerase fait une copie ADN 
du genome ARN ; cette copie peut alors s'integrer dans le genome humain. Les retro- 

30 virus ne tuent pas les cellules qu'ils infectent, mais au contraire ameliorent souvent 
leur rapidite de croissance. Les retrovirus peuvent infecter des cellules germinales ou 
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des embryons a un stade precoce ; ils peuvent dans ces conditions, integrer la lignee 
germinale et etre transmis par transmission mendelienne venicale. ce qui constitue la 
relation la plus etroite entre un hote et son parasite. Ces virus endogenes peuvent 
degenerer au cours des generations de Torganisme hote et perdre leurs proprietes ini- 
5 tiales. Cependant certains d'entre eux peuvent conserver tout ou panie de leurs pro- 
prietes ou des proprietes des motifs les composant ou encore acquerir de nouvelles 
proprietes fonctionnelles presentant un avantage pour Torganisme hote. ce qui expli- 
querait la preservation de leur sequence. 

1/ existence de motifs endogenes presentant de longs cadres de 

10 lecture ouverts et/ou soumis a une forte pression de selection peut done etre indicatrice 
d'une fonction biologique preservee ou acquise, qui peut correspondre a un benefice 
pour Torganisme hote. Ces sequences retrovirales peuvent aussi subir, au cours des 
generations, des modifications discretes qui vont etre a meme de reveiller certaines de 
leurs potentialites et engendrer ou favoriser des processus pathologiques. II est apparu 

15 recemment necessaire de faire le bilan et d' identifier ces sequences afin de pouvoir 
evaluer leur impact fonctionnel. 

Les sequences retrovirales endogenes humaines ou HERVs repre- 
sentent une part importante du genome humain. Ces regions retrovirales se presentent 
sous plusieurs formes : 

20 - des structures retrovirales endogenes completes associant des 

motifs gag, pol et env, flanques de sequences nucleiques repetees, qui montrent une 
analogie significative avec la structure LTR-gag~pol~env-LTR des retrovirus infec- 
tieux, 

- des sequences retrovirales tronquees ; par exemple, les retro- 
25 transposons sont prives de leur domaine env et les retroposons ne possedent pas les 

regions env et LTR. 

Jusqu'a present l'etude de ces regions du genome a ete negligee chez 
THomme pour deux raisons essentielles : 

- l'existence d'insertions/deletions qui peuvent decaler le cadre de 
30 lecture et de mutations qui modifient la sequence. Ces modifications entrainent des 

alterations de la structure et par consequent de la fonction biologique de ces motifs. 
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- F absence d'associations averees avec des pathologies humaines. 
La connaissance. recente de fragments significativement representa- 
tifs du genome humain et une orientation des recherches vers une etude struc- 
ture/fonction des motifs retroviraux endogenes, ont permis de preciser Finteret de ces 

5 regions, [/implication de sequences endogenes tronquees ou completes dans des 
pathologies chez ranimal est documentee ; par exemple leur association avec des 
processus tumoraux a ete clairement mise en evidence (S.K. Chattopadhyay et coll.. 
1982 ? Nature, 295, 25-31). Une recherche visant a preciser F association ou F influence 
des HERVs dans des pathologies humaines se justifie done aujourd'hui. 

10 Une classification des elements HERV a ete proposee (Tonjes R.R. 

et aL AIDS & Hum. RetroviroL, 1996, 13, S261-S267; A.M. Krieg et aL FASEB J.. 
1992, 6, 2537-2544). Elle est basee sur une homologie de ces sequences avec des 
retrovirus isoles chez les animaux, a l'aide de sondes retrovirales heterologues. En 
effet, en general, les HERVs presentent relativement peu d'homologie avec des retro- 

1 5 virus infectieux humains connus. 

Les families de classe I presentent une homologie de sequence avec 
les retrovirus de mammiferes de type C ; on peut citer notamment la superfamille ERI, 
proche du virus MuLV (murine leukemia virus) et du virus BaEV (baboon endoge- 
nous virus). 

20 Les families de classe II presentent une homologie de sequence avec 

les retrovirus de mammiferes de type B tel que le MMTV (mouse mammary tumour 
virus) ou les retrovirus de type D tel que le SRV (squirrel monkey retrovirus). 

D'autres families ont egalement ete decrites ; parmi celles-ci, on peut 
citer des HERVs qui presentent, de maniere exceptionnelle, une homologie partielle 

25 avec HTLV-1 (RTVL-H) ou des virus de primates ; HRES-1, par exemple, presente 
une homologie de sequence avec des HTLVs. 

Les programmes de tres grand sequen9age du genome humain per- 
mettent aujourd'hui de disposer d'un nombre significatif de nouvelles sequences retro- 
virales. L'usage de logiciels de traitement de donnees permet d'identifter et d'analyser 

30 ces genes. Dans ce contexte une recherche systematique portant sur Fensemble des in- 
formations disponibles a ce jour a ete engagee afm d' identifier de nouvelles sequences 
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retrovirales endogenes humaines en fonction de certains criteres d anaiyse : 

- presence de longs cadres de lecture ouverts conserves au cours de 
revolution de Torganisme hote et pouvant laisser envisager une fonction biologique. 

- analogie avec des sequences deja caracterisees en dehors ou dans le 
5 domaine des retrovirus, 

- localisation dans des regions de susceptibilite pour certaines patho- 
logies ou a proximite de genes essentiels, par exemple dans les domaine du cancer, des 
regulation du systeme immunitaire ou dans certaines neuropathologies. 

Les recherches effectuees par les Inventeurs. dans des bases de don- 
10 nees de sequences leur ont permis d'identifier un ensemble de sequences ou de motifs 
retroviraux endogenes dont r expression normale ou pathologique peut favoriser ou 
perturber un efFet protecteur vis-a-vis de processus pathologiques, ou intervenir dans 
le decienchement ou l'aggravation de pathologies. 

La presente invention a pour objet un fragment d'acide nucleique 
15 purifie, caracterise en ce qu'il comprend tout ou partie d'une sequence codant pour une 
sequence retrovirale endogene humaine, qui presente au moins des motifs retroviraux 
de type env, repondant a la sequence SEQ ID NO: 1 ou a une sequence presentant un 
niveau d'homologie avec ladite sequence SEQ ID NO: 1 superieur ou egal a 80% sur 
plus de 190 nucleotides ou superieur ou egal a 70 % sur plus de 600 nucleotides pour 
20 les domaines de type env. 

On entend par sequence homologue, aussi bien une sequence qui 
presente une identite complete ou partielle avec la sequence SEQ ID NO:l precitee 
qu'une sequence qui presente une similarite partielle avec ladite sequence SEQ ID 
NO:l. 

25 Selon un mode de realisation avantageux dudit fragment, il presente 

k la fois des motifs retroviraux correspondant a un domaine env et repondant a la 
sequence SEQ ID NO:l et des motifs retroviraux correspondant a un domaine gag et 
repondant h la sequence SEQ ID NO:2 ou a une sequence presentant un niveau 
d'homologie superieur ou egal a 80 % sur plus de 190 nucleotides ou superieur ou 

30 egal a 70 % sur plus de 600 nucleotides pour les domaines de type env et un niveau 
d'homologie superieur ou egal a 90 % sur plus de 700 nucleotides ou superieur ou 



WO 99/67395 



PCT/FR99/01513 



5 

egal a 70 % sur plus de 1200 nucleotides pour les domaines de type gag. iesquels 
motifs ne presenters aucune insertion ou deletion de plus de 200 nucleotides. 

Lesdits fragments constituent une nouvelle famille de sequences 
retrovirales endogenes humaines (famille HERV-7q) qui presente une homologie de 
5 sequence avec les retrovirus MSRV, tels que decrits dans la Demande Internationale 
WO 97/06260 ; lesdits fragments selon la presente invention presentent : 

- deux motifs nucleotidiques repetes de 71 1 pb (figure 3), presentant 
des signaux caracteristiques identifies dans des LTRs (Long Terminal Repeats) : 
promoteurs de transcription de type boites TATAA ou CCAAT. Ces domaines repetes 

1 0 encadrent trois motifs deduits de type-gag, pol et env (figure 2). 

- un motif de type env (positions 6965 nt - 9550 nt sur la sequence 
SEQ ID NO :3 ou sur la figure 1) qui contient un long cadre de lecture ouvert de 1620 
nucleotides (positions 7874-9493 de la sequence ID NO:3 et figure 1), codant pour 
une proteine de sequence inedite de 540 acides amines appelee enverine (figure 4 et 

15 SEQ ID NO:26) et fragment souligne de la figure 18. On retrouve a rinterieur du 
domaine trans-membranaire de ce domaine env, un motif peptidique de type CKS- 
25/CKS-17 (figure 5), reconnu pour presenter des fonctions immunosuppressives sur 
les cellules lymphocytaires hotes (M. Mitani et colL 1987, Proc. Natl Acad. Sci. 
USA, 84, 237-240). Un domaine de type doigt de zinc (zinc-finger) HX^H^. 

20 33 CX 2 C (Kulkolski et coll., 1992, Mol Cell. Biol., 12. 2331-2338), que Ton retrouve 
dang des domaines de type integrase est identifie dans un autre cadre de lecture. Ce 
domaine env particulier signe la caracteristique de nouveaux motifs retroviraux 
endogenes. 

- le motif (positions 3065 nt - 4390 nt sur la sequence SEQ ID NO:3) 
25 de type-gag codant pour des motifs proteiques selon la figure 6 (SEQ ID NO:58) 

(positions 3118-4198 de la SEQ ID NO:3) a 6te identifie grace a des analogies avec 
des domaines gag connus. On retrouve, par exemple, la region d'homologie majeure 
QX3EX7R (Benit et coll., 1997, J. Virol, 71, 5652-5657). Le motif de fixation des 
acides nucleiques CX 2 CX W HX4C, situe en position C-terminale, est identifie dans un 
30 autre cadre de lecture (Covey et coll., 1986, Nucleic Acids Res., 14, 623-633). En 
amont du domaine gag on detecte un motif de 182 nucleotides repete deux fois (figure 
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1). 

- le domaine pol presente les consensus classiques d'une region pol 
de retrovirus au niveau des domaines protease, transcriptase reverse et RNAse H. On 
retrouve dans pol un motif proche du consensus LLDTGA (Weber et coll.. 1988. 

5 Science, 243, 928-931). Les motifs D et AF, LPQ et SP, et YVDD (Xiong et 
Eickbush, 1990, EMBO J., 9. 3353-3362). sont respectivement retrouves dans les 3°. 
4° et 5° boites d'homologie. Les motifs YTDGSS et TDS sont presents dans la region 
de la RNAse H, 

- les regions gag et pol pourraient etre considerees comme jointives 
10 avec un passage de la region gag a la region pol par un decalage du cadre de lecture. 

La presente invention englobe les sequences appartenant a la famille 
HERV-7q telle que definie ci-dessus (presence de la sequence SEQ ID NO:l ou d'une 
sequence homologue ou presence a la fois des sequences SEQ ID NO: 1 et SEQ ID 
NO:2) et notamment les sequences SEQ ID NO:3-22, 28 et 61 ; elle englobe egale- 
15 ment les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes ainsi que les fragments issus des regions 
cddantes des sequences precedentes correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. (SEQ ID NO :37-57, 59-60 
et 121-122). 

20 Ces differents fragments peuvent avantageusement etre utilises 

comme amorces ou corame sondes (reactifs A) ; ils s'hybrident specifiquement dans 
des conditions de forte stringence a une sequence de la famille HERV-7q. 

Parmi ces fragments, on peut citer, de preference les fragments 

suivants: 

25 - un fragment de 1 82 nucleotides repete deux fois, situe en amont du 

domaine gag aux positions 2502-261 1/2613-2865 de la SEQ ID NO:3 ; 

Amorces et sondes specifiques de la region gag 

- une amorce GIF, sens, localisee dans la region amont du domaine 
gag de HERV-7q : 5' GGACCATAGAGGACACTCCAGGACTA 3' 

30 (SEQIDNO:37); 

- une amorce G1R. anti-sens, localisee dans la region 3' terminale du 
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domaine gag : 5' CCTCAGTCCTGCTGCTGGATCATCT 3 1 (SEQ ID NO:38) 

- le fragment de 1505 nt amplifie par le couple G1F-G1R est utilise 
afin de generer les sondes aptes a hybrider les differents produits d'amplification des 
PCR; 

- une amorce G2F, sens nichee : (SEQ ID NO:39) 
5' CCTCCAAGCAGTGGGAGGAAGAGAATT 3 ; 

- une amorce G2R, anti-sens nichee : (SEQ ID NO:40) 
5' CCTTCCCTGTGTTATTGTGGACATCATT 3' 

- une amorce G4F, sens nichee : (SEQ ID NO:4I) 

5 ? GGAAGAAGTCTATGAATTATTCAATGATGT 3* 

- une amorce G3F, sens nichee: (SEQ ID NO:42) 

5' GGGACACAGAATCAGAACATGGAGATT 3' 

- une amorce G4R, anti-sens nichee : (SEQ ID NO:43) 
5' GCCTTCAGAAGAGTCAGGTGACAGAGA 3' 

- une amorce GSR, anti-sens nichee : (SEQ ID NO:44) 
5'GAGCCTCCAAAGTCCACTTGCCTGA 3' 
Amorces et sondes specifiques de la region env 

- une amorce E1F, sens : (SEQ ID NO:45) 

5' GATTTCAGTATCTACTAGTCTGGGTAGAT 3' 

- une amorce E1R, anti-sens : (SEQ ID NO:46) 

5' CTAGGAAATCCAGCTAGTCCTGTCTCA 3' 

- le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 

- une amorce E2F, sens : (SEQ ID NO:47) 

5' CCAAGACAGCCAACTTAGTTGCAGACAT 3' 

- une amorce E2R, antisens : (SEQ ID NO:48) 

5' GGACGCTGCATTCTCCATAGAAACTCTT 3' 

- une amorce E3F, sens : (SEQ ID NO:49) 

5' GCAATACTACATACACAACCAACTCCCAA 3' 
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- une amorce E3R, anti-sens : (SEQ ID NO:50) 

5' GGGGGAGGCATATCCAACAGTTAGTA y 

- une amorce E4F, sens : (SEQ ID NO:51) 

5' CCATCTACACTGAACAAGATTTATACACTT 3 ; 
5 - une amorce E4R, anti-sens : (SEQ ID NO:52) 

5' AATGCCAGTACCTAGTGCACCTAGCACT 3 ? 

- une amorce E5F, sens : (SEQ ID NO:53) 

5' CGAATACAACGTAGAGCAGAGGAGCTTCGAA 3 1 

- une amorce E6F, sens : (SEQ ID NO: 54) 

10 5' AGCCCAAGATGCAGTCCAAGACTAAGAT 3' 

- une amorce E5R : (SEQ ID NO:55) 

5 ' GCGT AGT AG AGGTTGTGC AGCTG AG AT 3' 

- une amorce ExF : (SEQ ID NO:56) 
CCCTTACCAAGAGTTTCTATGGAGAAT 

15 - une amorce ExR : (SEQ ID NO:57) 

ACCGCTCTAACTGCTTCCTGCTGAATT 
Tous les oligonucleotides sont consus pour pouvoir generer une 
amorce sens et une amorce anti-sens par un decalage de la sequence de Tamorce de 
reference de 1 a 7 nucleotides vers le cote 5' ou vers le cote 3 ? : la modification de la 
20 sequence peut entrainer une modification de la taille de l'amorce de 1 a 7 nucleotides 
selon les cas. Les amorces choisies peuvent etre optimisees selon les cas par un 
raccourcissement ou un allongement portant sur 1 a 9 nucleotides. 

De maniere preferee, Fhybridation. le clonage, le sous-clonage, 
l'obtention, la preparation et l'analyse des acides nucleiques, des peptides et des anti- 
25 corps, le sequensage des acides nucleiques et des peptides, Thybridation in situ et 
1'immunohistochimie sont realises dans les conditions decrites dans les ouvrages 
suivants : 

- Current Protocols in Molecular Biology. Eds. F.M Ausubel, R. 
Brent & R.E Kingston et coll. Green Publishing associates and Wiley Interscience. 

30 - Molecular Cloning: a laboratory manual. Eds. J. Sambrook, E.F. 

Fritsch & T. Maniatis. Cold Spring Harbor Laboratory Press. Cold Spring Harbor. 
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- The Practical Approach series. Eds. D. Rickwood & B.D. Ames. 
IRL Press and Oxford University Press. En particulier, antibodies I & II; DNA cloning 
I, II, III; Nucleic acid and protein sequence analysis; Nucleic acid hybridization; 
Nucleic acid sequencing ; Oligonucleotide synthesis; Protein purification applications; 

5 Protein purification methods; Protein sequencing; Transcription and translation; Gels 
electrophoresis of nucleic acids; Gels electrophoresis of proteins; Genome analysis; 
HPLC of macromolecules; Human genetic diseases; Microcomputing in biology; 
Molecular neurobiology; Mutagenicity testing; Essential molecular biology I & II. 

- Proteome research: New frontiers in functional genomics. Eds 
10 M.R. Wilkins & coll.. Springer. 

La sequence retrovirale endogene humaine (SEQ ID NO:3). situee 
sur le bras long du chromosome 7 correspond a la sequence HERV-7q ; elle presente 
10,5 kb (fig. 1 et 2) et repond aux criteres precedemment definis. 

La recherche de domaines presentant des similitudes, tout ou partie, 

15 avec les regions gag et env de HERV-7q a abouti a F identification de nouvelles 
sequences retrovirales endogenes. Ces sequences peuvent presenter la structure d T un 
retrovirus endogene complet comme la sequence retrovirale endogene situee a proxi- 
mite du gene des sous-unites alpha et delta du recepteur des celiules-T, et denommee 
en consequence HERV-TcR ; a titre d'exemple la figure 7 montre la comparaison des 

20 alignements nucleiques des domaines gag respectifs de HERV-7q et HERV-TcR 
(sequence HG12, SEQ ID NO: 19). On trouve aussi des structures retrovirales 
partielles. Ces domaines retroviraux similaires a HERV-7q sont identifies dans des 
sequences nucleiques independantes comme le montre leur localisation chromo- 
somique. Des motifs nucleiques (appeles ici, HEx ou HGx et respectivement analo- 

25 gues a des domaines de type env ou gag) ressemblant aux domaines env ou gag de 
HERV-7q ont ete retrouves, k 1'aide des banques de donnees precitees : 

- HE2 : chromosome 17 (SEQ ID NO:4), 

- HE3 et HG3: chromosome 6 (SEQ ID NO:5 et 6), 

- HE4 : chromosome X (SEQ ID NO:7), 

30 -HE5 : chromosome X q22 (SEQ ID NO:8), 

- HE6 et HG6 : chromosome 1 q23.3-q24.3 (SEQ ID NO:9 et 10), 
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- HE7 : chromosome 7 pl5 (SEQ ID NO:l 1), 

-HE8 et HG8 : chromosome 19(SEQ IDNO:12et 13). 

- HE9 : chromosome X (SEQ ID NO: 14), 

-HE10 : chromosome X q 1 3. 1 -2 1 . 1 (SEQ ID NO: 1 5), 
5 - HE11 et HG1 1 : chromosome 7 q21-22 (SEQ ID NO:16 et 17), 

- HE 12 et HG12, dans HERV-TcR : chromosome 14 ql 1.2 (SEQ ID 

NO:18etl9), 

- HE 13 (SEQ ID NO:61) : chromosome 6 q24. 1-24.3 

La presente invention englobe egalement les fragments codants et 
10 non codants pour tout ou partie de Fenverine comprenant au moins 14 nucleotides et 
notamment les fragments codant pour la partie C-terminale de I'enverine, soit a partir 
de l'acide amine 291, soit a partir de l'acide amine 321, a compter de la premiere 
methionine. 

Ces fragments comprennent en particulier une zone critique oil deux 
15 insertions de 12 nucleotides ont ete caracterisees : 

- une premiere insertion a ete identifiee (sequence A), chez des indi- 
vidus de 2 groupes (malades et temoins). Cette insertion situee entre les acides amine 
487 et 488, permet d'inserer le tetrapeptide VLQM. Une analyse comparative montre 
que cette insertion est identifiee dans une region homologue situee dans la sequence 

20 HE13, appartenant a la famille HERV-7q. [/amplification de la sequence de type 
HE13, pourrait indiquer qu'il existe une alteration de la sequence de Tenverine de 
HERV-7q, ce qui favoriserait F amplification de la sequence contenue dans HE13. 
Cette observation permet aussi d'utiliser cette insertion comme element specifique 
d'amplification de sequences de type HE13. 

25 Une deuxieme insertion (sequence B) a ete identifiee chez un patient 

presentant une SEP. L'insertion de 12 nucleotides est situee au niveau de l'acide 
amine 495 et code pour le tetrapeptide MQSM. II est remarquable de constater que 
cette insertion est aussi identifiee dans une region homologue situee dans HE13. 

Sequence A: TAAACTACAAATGG TTCTTCAAATGG AGCCCA 

30 (SEQIDNO:59) 
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Sequence B: GATGCAGTCCAAGATGCAGTCCATGACTAAGA 

(SEQ ID NO:60). 

Ces observations mettent en evidence des modifications de la 
sequence de I'enverine de type HERV-7q qui constituent la base d ? une strategic de 
5 detection par amplification specifique d'alleles (AS-PCR), permettant de detecter ces 
differences dans une population et qui pourraient correspondre, soit a une muta- 
tion/deletion associee a une certaine susceptibility soit a un polymorphisme, soit a une 
mutation/deletion associee a une pathologie comme la sclerose en plaques. 

Les alignements des domaines env (fig. 8) et gag (fig. 9) explicitent 
10 les niveaux d'homologie observes entre les sequences decrites ci-dessus et les sequen- 
ces homologues dans HERV-7q. Les analogies peuvent s'etendre aux motifs retro- 
viraux flanquants. 

Une analyse des sequences etiquettes disponibles dans les banques 
de donnees montre que des transcrits appartenant a certains des membres de cette 
15 famille, en particulier HERV-7q, s'expriment essentiellement dans des tissus d'origine 
foetale ou placentaire. 

Des sequences polypeptidiques generees par ces transcrits peuvent 
done etre potentiellement produites et des fonctions ou activites biologiques peuvent 
etre envisagees, par analogie avec des polypeptides biologiquement actifs d'origine 
20 virale ou retrovirale ; par exemple, les motifs peptidiques de type CKS-17 (Haraguchi 
et al., PNAS, 1995, 92, 5568-5571) (fig. 5) ou CKS-25 (Huang S.S et Huang J.S, J. 
Biol. Chem. 1998, 273, 4815-4818), qui presentent des fonctions immunomodulatrices 
sur les cellules lymphocytaires hotes. Les differences de sequence observees et 
d'eventuelles modifications normales ou pathologiques, sont en particulier, a l'origine 
25 d'une modulation de la fonction. 

HERV-7q represente le paradigme de la nouvelle famille de 
sequences retrovirales endogenes humaines ou de motifs retroviraux endogenes. 

HERV-7q et certaines des sequences retrovirales endogenes apparte- 
nant a sa famille, presentent un domaine de type pol analogue a des sequences retro- 
30 virales de type pol comme par exemple la region pol identifiee dans le retrovirus 
MSRV associe a la sclerose en plaques et decrit par H. Perron et al. (1997, Proc. Natl. 
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Acad ScL USA, 94, 7583-7588.; Demande Internationale PCT WO 97/06260). 

Toutefois, les sequences selon la presente invention se distinguent 
des sequences retrovirales exogenes infectieuses analogues a MSRV anterieurement 
decrites en ce que les sequences gag et env, selon Tinvention sont significativement 
5 differentes selon les criteres precedemment definis et en fonction de certaines caracte- 
ristiques specifiques, par exemple le long cadre de lecture ouvert du domaine env de 
HERV-7q ; elles seraient a meme de permettre de signer une pathologie lorsqu'elles 
presentent des insertions, des deletions, des decalages de cadre de lecture ou des 
mutations. 

10 En effet, les differences observees entre les sequences humaines de 

type HERV-7q, qui sont isolees d'individus reputes normaux et les sequences issues 
de certains echantillons d'origine pathologique, ne sont pas distributes au hasard. Des 
comparaisons menees entre la region gag provenant de particules retrovirales infec- 
tieuses (N° d'accession EMBL: A60168, A60200, A60201, A6017L..) et la sequence 

15 gag correspondante de HERV-7q (fig. 9), perraettent d'observer que les mutations 
affectent preferentiellement des codons non-sens. Par exemple. deux codons non-sens 
dans HERV-7q sont remplaces par un codon arginine dans A60200, ce qui permet 
d'obtenir une sequence deduite de 109 acides amines pour HERV-7q et de 166 acides 
amines pour A60200. Les changements de base permettent en consequence de prolon- 

20 ger le cadre de lecture et de coder potentiellement pour des structures polypeptidiques 
de plus grande taille (figure 10). 

De meme, une sequence de type env provenant de particules retro- 
virales infectieuses, presente une analogie significative avec le domaine env de 
HERV-7q (figure 11). Ces analogies marquees entre sequences retrovirales exogenes 

25 et endogenes pourraient etre a l'origine du declenchement ou de V aggravation de 
certains processus pathologiques, en particulier de certaines maladies auto-immunes, 
comme la sclerose en plaques. A cet egard, on peut remarquer que certaines des 
sequences retrovirales endogenes decrites dans 1' invention se situent a proximite ou 
dans des regions reputees presenter une susceptibilite pour la sclerose en plaques : par 

30 exemple HERV-7q et la region 7q21-22 du chromosome 7, de meme pour HE 12 et 
HG12 dans HERV-TcR et la region du gene codant pour les chaines alpha et delta du 
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recepteur des cellules-T, HE2 et le chromosome 17, ou HE3, HE 13 et HG3 et le 
chromosome 6, par exemple, les sequences HE1 1 et HG1 1, autour de la region 7q 21- 
22 ou encore HE4, HE5, HE6, HE9 ? HE10 ou HG10 sur le chromosome X. Ces 
sequences seraient done a meme de fournir des moyens de localisation ou 
5 d' identification des genes de predisposition. 

On n'observe aucune homologie significative avec des sequences 
retrovirales endogenes deja decrites, par contre, on peut relever une homologie 
limitee, permettant d' identifier une structure generate de domaine env; toutefois, 
ladite homologie est inferieure aux criteres definis selon Tinvention entre les 

10 domaines env de la sequence HERV-7q (SEQ ID NO :1) et de la sequence HERV-9 
(figure 12). La figure 1 1 montre des homologies etendues entre la sequence HERV-7q 
avec une sequence retrovirale exogene (N° d'accession EMBL : A60170). 

Les sequences retrovirales endogenes humaines appartenant a la 
famille de HERV-7q, peuvent proteger contre des agressions liees a l'environnement 

15 ou constituer un benefice pour Pindividu. Cet effet benefique pourrait etre une des 
raisons possibles de la pression de selection exercee sur certaines de ces sequences et 
du caractere potentiellement fonctionnel des structures proteiques deduites identi- 
fiees : par exemple le long cadre de lecture ouvert apte a coder pour une nouvelle pro- 
teine et correspondant au domaine env de HERV-7q. 

20 Les sequences retrovirales endogenes humaines appartenant a la fa- 

mille de HERV-7q pourraient etre associees par exemple, a des pathologies en relation 
avec les processus lies au cancer, aux neuropathologies a composante auto-immune ou 
k tout autre processus pathologique en association ou non avec des virus ou retrovirus 
endogenes ou exogenes. Leur action pourrait porter sur la declaration, 1' aggravation, la 

25 modification du calendrier d'apparition ou encore la protection vis a vis de la maladie. 

Dans le contexte d'application a des pathologies autoimmunes 
(comme par exemple le lupus, le syndrome de Sj5gren, la polyarthrite rhumatoide, la 
sclerose en plaques...), on peut relever des analogies significatives entre les motifs re- 
troviraux endogenes identifies et des motifs retrouves dans des structures retrovirales 

30 caracterisees chez des patients presentant des pathologies autoimmunes comme la 
sclerose en plaques : par exemple des fragments de domaine gag (recemment dispo- 
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nibles dans les banques de donnees) provenant de particules retrovirales infectieuses 
ou encore la sequence complete du domaine pol correspondant au virus MSRV associe 
a la sclerose en plaques. Ces motifs retroviraux possedent des analogies significatives 
avec les sequences endogenes homologues de type HERV-7q, ce qui permet 
5 d'envisager une association directe ou indirecte avec des processus pathologiques.. 
dont la sclerose en plaques, en association ou non avec MSRV. 

L'interet de ces sequences depasse le cadre des maladies auto- 
immunes. En dehors de I'importance generate des motifs retroviraux dans le declen- 
chement ou Taggravation d'un processus tumoral, bien montre en particulier dans les 

10 modeles murins (H. Fan dans The retroviridiae, 1994, ed. J. A. Levy. Plenum. New 
York, p. 313-353), ces sequences pourraient se retrouver a proximite ou au sein de 
genes importants et en alterer 1' expression : par exemple HERV-TcR et les genes des 
sous-unites alpha et delta du recepteur des cellules T impliquees dans des perturba- 
tions de la fonction immunitaire. 

15 La presente invention englobe, en outre, T utilisation de sequences 

associees aux sequences de la famille HERV-7q pour la detection et/ou le pronostic de 
differentes maladies auto-immunes (neuropathologies, en particulier) ; ces sequences 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 
1'alteration (polyadenylation, epissage alternatif) est associee a ['expression normale 

20 ou pathologique ou a la regulation/deregulation des motifs appartenant a la famille 
HERV-7q et correspondent a des transcrits ou des ADNc des sequences nucleotidiques 
codant pour des genes situes dans des regions flanquantes ou encadrant des sequences 
retrovirales de la famille HERV-7q. 

On entend par region flanquante, toute region situee a proximite 

25 (incluse dans ou incluant) une sequence retrovirale endogene appartenant a la famille 
HERV-7q, telle que definie ci-dessus, jusque et y compris les genes immediatement 
contigus et/ou situes a une distance ne pouvant exceder 120 kb. 

Les Inventeurs ont maintenant trouve que la presence des sequences 
retrovirales telles que defmies ci-dessus, perturbent Texpression ou alterent la struc- 

30 ture des sequences flanquantes definies ci-apres. 

Les transcrits desdites sequences flanquantes (et leurs fragments, 
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notamment ceux soulignes ou en italique dans les figures 14-16. 22-26, sont definies 
ci-apres : 

- a 1021 pb en amont de HERV-7q, on identifie une sequence retro- 
virale endogene appelee RH7 (SEQ ID NO: 62 et figure 22) ; cette sequence est situee 

5 en 5 J de la sequence HERV-7q ; dans la figure 22, la partie en italique correspond au 
debut de la sequence HERV-7q ; la sequence RH7 est soulignee ; deux sites de 
polyadenylation putatifs sont en gras. Cette sequence SEQ ID NO:62 presente une 
homologie significative, sur plus de 6 kb, avec des sequences retrovirales endogenes 
de type RGH (figure 13). Des sequences appartenant a cette famille s'expriment en 

10 particulier chez des patients presentant une arthrose rhumatoide (Nakagawa et coll., 
(1997), Arthritis. Rheum., 40, 627- 638). La presente invention inclut egalement des 
fragments de la sequence SEQ ID NO:62, comprenant entre 14 et 50 nucleotides 
(utilisation comme amorces), de preference entre 14 et 25 nucleotides ou au moins 25 
nucleotides (utilisation comme sonde), lesquels fragments presentent les caracteris- 

15 tiques suivantes : les 4 nucleotides de l'extremite 3' sont differents des motifs corres- 
pondant de la sequence RGH2 (sequence du bas dans la figure 13, n° accession a 
GenBank:D110 18). 

- a moins de 9 kb en amont de HERV-7q, on identifie la sequence 
RAM75 (SEQ ID NO:63 et figure 14) contenant les 24 exons codants (qui couvrent 

20 pres de 41 kb), du gene de TATPase peroxysomale PEXL PEX1, en association avec 
PEX6 est responsable de V importation des proteines peroxysomales et de la stabilisa- 
tion du recepteur PEX5. Une perturbation/alteration affectant PEX1 est responsable de 
diverses neuropathologies comme le syndrome de Zellweger, radrenoleucodystrophie 
neonatale et la forme infantile de la maladie de Refsum (Reuber et coll., (1997), 

25 Nature Genet., 17, 445- 448). On peut rappeler que la fonction principale des peroxy- 
somes est associee au metabolisme des acides gras, en particulier par des processus de 
P-oxydation. Une alteration du gene identifie dans la sequence RAM75 ou de son 
expression, par modification de la fonction des regions 5* et 3' regulatrices ou encore 
par modification des epissages ou des processus de polyadenylation, en particulier 

30 sous T influence de motifs retro viraux voisins, seraient a meme de perturber 
Texpression ou la structure de 1'ATPase et par consequent de perturber une des 
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fonctions peroxysomales, en particulier le metabolisme des lipides, en particulier 
myeliniques, avec des consequences pour certaines pathologies, dont des neuropatho- 
logies, comme la sclerose en plaques ; les parties soulignees (figure 14) correspondent 
aux 24 exons codants. 

5 La presente invention inclut egalement les fragments de la sequence 

SEQ ID NO:63, inclus dans les 24 exons codants precites et comprenant au moins 14 
nucleotides. 

L'analyse du profil depression (transcrits et proteines) de la 
sequence RAM75 (SEQ ID NO:63) est un bon indicateur du diagnostic differentiel des 
1 0 neuropathologies a composante auto-immune. 

A la figure 14, les exons codants sont soulignes. Les codons 
d' initiation et non-sens ainsi que les sites putatifs de polyadenylation sont en gras et 
soulignes. 

- a 0.7 kb en aval de la sequence HERV-7q et sur pres de 17 kb 
15 (SEQ ID NO:64 et figure 15), on identifie la sequence nucleotidique RAV73, ou Ton 

detecte des sequences etiquettes et des exons potentiels aptes a produire une ou 
plusieurs sequences polypeptidiques ; Finvention inclut egalement des fragments de 
cette sequence SEQ ID NO:64 compris dans les sequences etiquettes et les exons 
potentiels tels qu'ils apparaissent (parties soulignees) a la figure 15, lesquels 
20 fragments component au moins 1 4 nucleotides. 

- a 120 kb en amont de la sequence HG3, et sur 15 kb, se trouve la 
sequence nucleotidique RBP3 (SEQ ID NO:65 et figure 23), qui couvre Pextremite 
3'du gene codant pour un facteur de transcription de la famille Blimp- 1 (SEQ ID 
NO: 119 et figure 25), une proteine de 789 acides amines qui est un represseur de 

25 r expression du gene de Tinterferon-beta (Keller et Maniatis, Genes Dev., (1991), 5, 
868-879), qui est deja associe a certaines pathologies malignes (Mock et coll., 
Genomics, (1996), 37, 24-28), et qui pourrait jouer un role dans la differentiation et la 
pathogenese des cellules B. L'interet de T association possible de la sequence retro- 
virale endogene contenant les motifs HG3 et HE3 et de Blimp-1 est multiple, dans le 

30 cas de pathologies, et en particulier la sclerose en plaques. Blimp-1 agit en particulier 
sur les cellules B dont on connait la contribution dans les processus inflammatoires 
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associes a la sclerose en plaques. Blimp- 1 est capable de bloquer P induction virale du 
promoteur INFP dont on connait Paptitude a reduire la frequence des poussees et la 
progression lesionnelle chez des patients atteints de SEP. Une perturbation de 
['expression ou de la structure de Blimp- 1, en relation avec un element retroviral de 
5 type HERV-7q, est associee en consequence a des neuropathologies ou a des maladies 
a caractere auto-immun, comme la sclerose en plaques ; cette sequence nucleotidique 
RBP3 (SEQ ID NO:65) contient des motifs nucleotidiques identifies dans la sequence 
nucleique codant pour le gene Blimp-1 ; Pinvention inclut aussi la detection des 
sequences ARNm de la proteine Blimp- 1 (SEQ ID NO: 1 1 9). 

10 - la sequence retroviral endogene de type HERV-7q ; contenant HE3 

et HG3. se trouve situee dans la region HIS correspondant a un intron s'etendant sur 
plus de 46 kb (SEQ ID NO:66), d'un gene qui pourrait coder pour Panalogue d'APS 
(figure 24), une proteine de 275 acides amines specifique d'apoptose. surexprimee 
dans differents cellules en culture apres declenchement d'un processus apoptotique 

15 (Hammond et coll., FEBS Lett., (1998), 425, 391- 395). L'intron se situe au niveau de 
l'acide amine 231 d'APS. L'extremite de HE3 est a plus de 12 kb de Pextremite 5' de 
Pintron, alors que HG3 est situe a plus de 28 kb de Pextremite 3' de Pintron. Des 
processus apoptotiques sont associes a la sclerose en plaques. En particulier. il a ete 
decrit un processus apoptotique affectant des astrocytes et des oligodendrocytes en 

20 presence d'une fraction purifiee de liquide cephalo-rachidien de patients atteints de 
sclerose en plaques (Menard et coll., J. Neurol. Sci., (1998) , 154, 209- 221). 

Enfin, il faut souligner que la region nucleique contenant HE3, HG3, 
HI3 et RBP3 est localisee au niveau du bras court du chromosome 6, en 6p21, qui est 
une region proposee de susceptibilite a la sclerose en plaques (The Multiple Sclerosis 

25 Genetic Group, Nature Genet, (1996), 13, 469- 472). 

L' interaction entre les sequences de type HERV-7q et les sequences 
flanquantes et Pimportance de Petablissement d'un profil depression incluant une ou 
plusieurs des sequences precitees pour etablir un diagnostic differentiel d'une neuro- 
pathologie apparmt encore plus du fait que Pon observe que les sequences HGI2 et 

30 HE 12 sont situees dans une region intronique du gene codant pour les sous-unites 
alpha et delta des recepteurs des cellules T. Les recepteurs des cellules T sont impli- 
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ques dans les processus de regulation immunitaire et leur influence a ete proposee 
dans le cas de maladies auto-immunes, dont la sclerose en plaques. 

[/invention a egalement pour objet les transcrits generes a partir des 
sequences precitees ainsi que celles presentant eventuellement des modifications avec 
5 les sequences de reference decrites dans Tinvention lorsqu'ils sont exprimes chez 
certains patients. 

En effet, les systemes de regulation de V expression des proteines 
retrovirales de HERV-7q, qui sont presents dans les motifs de type LTR, pourraient 
influencer l'expression de genes situes dans le voisinage chromosomique proche ou 

10 eloigne et induire des perturbations a caractere immunologique et/ou neurologique. 
Par exemple la sequence retroviral endogene HERV-TcR, se trouve a proximite 
immediate des genes des sous-unites alpha et delta du recepteur des cellules-T prece- 
demment decrit. Les motifs de type LTR pourraient aussi coder pour des superanti- 
genes (Acha-Orbea et Palmer, 1991, Immunol. Today, 12, 356-361). D'une maniere 

15 generale des proteines retrovirales de type HERV-7q ou apparente, ou leurs formes 
tronquees ou partielles pourraient etre impliquees dans des phenomenes de cytotoxi- 
cite ou de superanteginicite, comme par exemple celles issues du long cadre de lecture 
ouvert identifie dans le domaine env (figure 4). 

Des sequences du type des LTR 5' et 3' de HERV-7q. fortement 

20 conservees sont concernees par de tels efFets regulateurs. A titre d'exemple on decrit 
LTX, une sequence comparable a celle d'une LTR de HERV-7q (SEQ ID NO:67 et 
figure 16), et qui se trouve au coeur d'un intron de plus de 49 kb, mais a 2 kb du site 5' 
donneur, du gene de FMR2 associe au X-fragile et codant pour une proteine de 1311 
acides amines (figure 26). Les LTR modulent 1'epissage alternatif (Kapitonov et 

25 Jurka, (1999), J. Mol. Evol., 48, 248- 251), l'expression du gene, la fixation sur des 
proteines nucleaires (Akopov et coll., (1998), FEBS Lett., 421 ; 229- 233), ou permet- 
tent Tobtention d'un signal de polyadenylation alternatif (Goodchild et coll., (1992) , 
Gene, 121,287-294). 

D'une maniere generale, on peut remarquer Texistence de plusieurs 

30 sequences retrovirales endogenes de type HERV-7q (HE4, HE5, HE9, HE10), situees 
au niveau du chromosome X qui represente le chromosome associe au plus grand 
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nombre de pathologies. 

A cet egard, on peut relever que des motifs retro viraux issus de 
regions defectives sont aptes a presenter des fonctions biologiques: par exemple. la 
proteine d'enveioppe p!5E issue de motifs retroviraux defectifs, possede une activite 
5 anti-inflammatoire et immunosuppressive (Snyderman et Ciancolo, 1984 ? Immunol 
Today, 5, 240-244). 

Ces structures sont vraisemblablement a meme de provoquer des 
breches ou d'amplifier des deregulations dans les processus de defense immunitaire. 
Certains des motifs des domaines gag, env et de type LTR peuvent etre associes a une 

10 fonction particuliere ou peuvent contribuer a la fonction normale ou pathologique des 
domaines flanquants tels que definis ci-dessus (SEQ ID NO:62-67). Des recombinai- 
sons avec un element d'origine exogene, retroviral ou non r peut donner lieu a la 
production de motifs nucleiques ou proteiques qui pourraient soit proteger, soit 
declencher, ou favoriser ou aggraver une pathologic De meme, une structure retro- 

15 virale contenant des elements retroviraux endogenes selon l'invention seraient a meme 
de provoquer un processus pathologique apres passage par un cycle transitoire 
exogene puis reintegration dans une region sensible ou critique du genome humain. 

On peut ainsi obtenir des profils depression (transcrits et even- 
tuellement proteines) qui correspondent aux neuropathologies precitees. 

20 De meme, la combinaison de motifs appartenant a la famille de 

HERV-7q, ou d'elements induits par des motifs appartenant a la famille de HERV-7q, 
avec des motifs d'origine ou induits de maniere exogene seraient a meme de pouvoir 
declencher, ou aggraver un processus pathologique ou au contraire de favoriser une 
protection ou une remission partielle ou une guerison totale et definitive. 

25 La detection rendue possible des domaines de type HERV-7q, 

suggere des applications possibles a la fois au niveau prophylactique, du pronostic et 
du diagnostic : par exemple des approches immunologiques ou d'amplification 
genique permettant de comparer des individus normaux servant de reference avec des 
patients, seraient a meme de favoriser le depistage, d'ameliorer la detection precoce de 

30 la declaration de la maladie et/ou de suivre revolution d'une pathologie chez des 
patients pouvant presenter une susceptibilite ou ayant declare la maladie ou encore 
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chez des individus consideres comme normaux, seion les criteres cliniques actuels. 

Les sondes nucleiques et immunologiques specifiques, telles que 
definies, dans la presente invention sont a meme de favoriser V identification et la 
detection de motifs anonnalement exprimes dans le cadre de pathologies associees au 
5 cancer, ou de neuropathologies en particulier auto-immunes, au premier rang 
desquelles la sclerose en plaques. 

La presente invention a egalement pour objet des sequences 
nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
appartenant a la famille de HERV-7q, ou d'elements induits par des motifs apparte- 
10 nant a la famille de HERV-7q, avec des motifs d'origine ou induits de maniere 
exogene (sequences retrovirales exogenes) ; de telles sequences hybrides sont vrai- 
sembiablement a meme de pouvoir declencher, ou aggraver un processus pathologique 
ou au contraire de favoriser une protection ou une remission partielle ou une guerison 
totale et definitive. 

15 La presente invention a egalement pour objet un reactif de diagnostic 

pour la detection differentielle de sequences nucleiques endogenes humaines 
completes ou partielles, presentant des motifs retroviraux, selectionnes parmi les 
sequences SEQ ID NO :1 et/ou SEQ ID NO :2, caracterise en ce qu'il est selectionne 
dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28, 37-57, 59-61 et 121- 

20 122, les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes, par les fragments nucleotidiques capables de 
definir ou d'identifier les sequences SEQ ID NO:l et/ou SEQ ID NO:2 et toute 
sequence flanquante ou les chevauchant ainsi que par les fragments issus des regions 
codantes des sequences SEQ ID NO: 1-22 et 61, correspondant a un cadre glissant 

25 superieur ou egal a 14 nucleotides ou leurs sequences complementaires, eventuelle- 
ment marquees avec un marqueur approprie ainsi que par les sequences telles que 
definies aux figures 18-21 . 

Les sequences des sondes nucleiques, ribonucleiques et oligo- 
nucleotidiques utilisees seront choisies dans les regions env et gag ou leur regions 

30 flanquantes : par exemple les oligonucleotides amorces pour HERV-7q, seront choisis 
dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
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9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3, ainsi que dans toute sequence 
adjacente (amont ou aval) capable de permettre une amplification specifique (figure 
1). 

Parmi les marqueurs appropries, on peut citer, les isotopes radio- 
5 actifs, les enzymes, les fluorochromes, des marqueurs chimiques (biotine). les 
haptenes (digoxygenine) et les anticorps ou analogues de bases appropriees. 
De maniere preferee : 

- ledit reactif est selectionne parmi les sequences SEQ ID NO :3 7-5 7 
et est apte a etre utilise comme amorce. 
10 - ledit reactif est selectionne parmi les sequences suivantes : 

un fragment de 1505 nt amplifie par le couple d'amorces SEQ 
ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R). 

un fragment de 2529 nt amplifie par le couple d'amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R), 
15 un fragment de 182 nucleotides repete deux fois, situe en amont 

du domaine gag aux positions 2502-261 1/2613-2865, 

des fragments codants ou non-codants pour tout ou partie de 
Fenverine, comprenant au moins 14 nucleotides et notamment les fragments codant 
pour la partie C-terminale de 1'enverine, soit a partir de Tacide amine 291 , soit a partir 
20 de Tacide amine 321, a compter de la premiere methionine, 
et est apte a etre utilise comme sonde. 

La presente invention a egalement pour objet un procede de detec- 
tion rapide et differentiel des sequences nucleiques retrovirales endogenes de type em 
ou env et gag, de leurs variants normaux ou pathologiques, par hybridation et/ou 
25 amplification genique, realise a partir d'un echantillon biologique, lequel procede est 
caracteris6 en ce qu'il comprend : 

(a) une etape dans laquelle Ton met en contact un echantillon biolo- 
gique a analyser avec au moins une sonde telle que definie ci-dessus et 

(b) une etape dans laquelle on detecte par tout moyen approprie, le 
30 ou les produits resultant de I'interaction sequence nucleotidique-sonde. 

Conformement audit procede, il peut comprendre : 



WO 99/67395 



PCT/FR99/01513 



22 

* prealablement a l'etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

concerne, 

. une etape d'extraction de Facide nucleique a detecter, et 
5 . au moins un cycle d'amplification genique et 

* posterieurement a l'etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
iedit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
l'invention par tout moyen approprie et notamment par sequensage. Southern-blot, 
10 coupure de restriction, SSCP ou toute autre methode permettant d' identifier une inser- 
tion ou une deletion ou encore une simple mutation entre les differentes sequences 
comparees. 

Conformement a l'invention, les sequences retrovirales endogenes 
humaines selon l'invention sont ainsi comparees aux sequences nucleiques presentes 
15 dans rechantillon biologique a analyser et permettent la detection de sequences 
homologues de patients atteints de pathologies, susceptibles de mettre en jeu une 
modification de leur genome. 

De maniere avantageuse, lesdites comparaisons geniques sont 
menees a partir d' ADN genomique provenant d'individus temoins et de patients. 
20 Une amplification genique classique par PCR sera menee a Faide 

d'amorces 5' -sens et 3' -antisens encadrant ou comprenant la zone a etudier (zone env 
ou zone gag). 

Egalement de maniere avantageuse, les sequences des sondes 
nucleiques, ribonucleiques et oligonucleotidiques utilisees sont choisies dans les 

25 regions env et gag ou leurs regions flanquantes : par exemple les oligonucleotides 
amorces pour HERV-7q, seront choisis dans les regions situees entre les nucleotides 
3065 et 4390 et les nucleotides 6965 et 9550, ainsi que dans toute sequence adjacente 
(amont ou aval) capable de pennettre une amplification specifique (figure 1), comme 
precise ci-dessus. Elles sont de preference selectionnees dans le groupe constitue par 

30 un fragment de 1505 nt amplifie par le couple d'amorces SEQ 

ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 
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un fragment de 2529 nt amplifie par ie couple d'amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R). 

L'etape d' amplification genique est notamment realisee a l aide 
d'une des techniques d'amplification genique suivante : amplification par la QP- 
5 replicase, PCR, LCR, ERA, CPR ou SDA 

La presente invention a egalement pour objet des sequences 
chimeres, caracterisees en ce qu'elles sont constituees par un fragment de 17 a 40 
nucleotides d'une sequence flanquante telle que definie ci-dessus associee a un motif 
retroviral endogene de type HERV-7q comprenant entre 1 7 et 40 nucleotides, tel que 
10 defini ci-dessus. 

La presente invention a egalement pour objet un procede de detec- 
tion des transcrits, tels que definis ci-dessus, caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques (tissus, cellules, fluides biologiques) temoins et d'un echantillon analogue 

1 5 preleve chez des patients et 

- Tanalyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR. a l'aide d'un 
reactif de diagnostic tel que defini ci-dessus. 

La presente invention a egalement pour objet une methode de detec- 
20 tion et/ou d'evaluation d'une sur-expression/sous-expression ou d'une modification 
d'au moins Tune des sequences ou fragments de sequences retrovirales endogenes de 
type HERV-7q et/ou de leurs sequences flanquantes associees. caracterisee en ce 
qu'elle comprend : 

- le depot sur un support approprie comme par exemple un filtre de 
25 nylon, une lame de verre ou leur equivalent, de TADNc ou son equivalent provenant 

de clones, de produits de PCR obtenus a partir d'ADN genomique, de produits de RT- 
PCR provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 
virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, telles que 
30 definies ci-dessus, constituees par les transcrits et ADNc des sequences genomiques, 
qui codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation 
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ou l'alteration est associee a P expression normaie ou paihologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d : une sequence retrovirale de ladite 
5 famille HERV-7q et dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, et/ou une sequence chimere telle que definie ci-dessus. 

- 1' hybridation dudit support avec au moins une sonde marquee de 
maniere adequate obtenue, par exemple, par retrotransposition d ! un melange d'ARN 
provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 

10 reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 

- la detection des hybrides formes. 

Selon un mode de mise en ceuvre avantageux de ladite methode, 
15 ledit transcrit ou ADNc est selectionne dans le groupe constirue par les sequences 
SEQ ID NO:62-67 et 1 19 et leurs fragments correspondant a un cadre glissant supe- 
rieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

Selon un autre mode de mise en ceuvre avantageux de ladite 
methode, ledit support comprend en outre toute sequence retrovirale endogene ou 
20 exogene. 

La methode des puces a ADN (Bowtell, (1999), Nature Genet., 21, 
25- 32), est utilisee pour evaluer la modification de ^expression de tout ou partie de 
certaines des sequences d'origine retrovirale de type HERV-7q et des sequences 
flanquantes. Brievement de 1' ADN provenant de clones, de produits de PCR obtenus a 

25 partir d' ADN genomique, de produits de RT-PCR provenant de transcrits ou encore de 
sequences oligonucleotidiques specifiques, sont deposees sur un support, comme par 
exemple un filtre de nylon, une lame de verre ou leur equivalent. Les sequences 
nucleiques deposees couvrent les differents domaines retroviraux decrits ci-dessus, 
ainsi que les sequences contigues et les genes flanquants. Afin de detecter d'eventuels 

30 processus d'epissage alternatifs, des ADN specifiques sont synthetises par pas de 500- 
600 nucleotides avec un chevauchement de 250- 300 nucleotides de part et d'autre. 
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Les epissages alternatifs deja identifies feront 1'objet d'une synthese specifique. 
L'hybridation s'effectue a l'aide d'une sonde obtenue, par exemple, par retrotranspo- 
sition d'un melange d 1 ARN provenant de cellules, de tissus ou de liquides biologiques 
provenant de temoins reputes normaux, de membres de populations ethniques diffe- 
5 rentes, de patients atteints de pathologies souvent associees a une expression de retro- 
virus, comme les processus tumoraux, ou corame les maladies auto-immunes, dont la 
sclerose en plaques. Dans ce cas une fraction de jig et jusqu'a quelques jig d'ARNm 
ou jusqu'a quelques jig ou dizaines de |ig d'ARN, selon la methode utilisee et la taille 
de la puce d'ADN concernee, sont suffisants pour la synthese de la sonde nucleique. 

10 La sonde nucleique est marquee de maniere adequate, afin d'autoriser une detection 
ulterieure, comme par exemple par fluorescence ou par une methode equivalents 

L' usage de sondes bi-, voire multicolores permet de preciser 
P expression concertee de plusieurs genes en parallele, en beneficiant de plus d'une 
normalisation precise. L'acquisition des resultats est effectuee automatiquement, 

15 comme par exemple par un systeme de balayage laser ou son equivalent. 

Deux types de puces a ADN sont con?ues, d'une part des puces 
presentant un ensemble exhaustif de sequences, et d'autre part des puces a ADN speci- 
fiques permettant un ciblage sur une application plus specifique. 

Par exemple, une sequence critique en ce qu'elle contiendrait une 

20 difference portant sur une deletion, voire une mutation, est detectee a l'aide 
d'oligonucleotides specifiques (Wang et coll., (1998), Science, 280, 1077- 1082). Le 
polymorphisme associe a une base ou a une mutation est detecte a Taide de quatre 
oligonucleotides possedant une des quatre possibilites de sequence au niveau d'une 
base (A, C G ou T): pour chaque difference ponctuelle les 4 oligonucleotides sont 

25 deposes et les intensites d'hybridation sont comparees. De plus, un epissage alternatif 
est detecte en utilisant des ADN correspondant a un seul exon effectif ou putatif : le 
gene est done analyst exon par exon. Les puces a ADN concernent aussi, par exten- 
sion, toute sequence retrovirale endogene ou exogene, comme par exemple ERV-9, 
ERV-K, ERV-L, ERV-H, ERV-4, ERV-6, ERV-8, ERV-10, ERV-15, ERV-16, ERV- 

30 17, ERV-18, ERV-21, ERV-24, ERV-33, ERV-34, ERV-36, ERV-40, ERV-42, ERV- 
MLN, ERV-FRD, ERV-FTD...), ainsi que toutes les sequences exoniques putatives 
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(identifiees par I'existence de sequences etiquettes et des transcrits correspondants) ou 
effectives, et qui sont situees de part et d'autre jusqu'a une distance de 120 kb des 
sequences retrovirales endogenes de type HERV-7q. 

L 'etude comparative est menee entre un echantillon temoin et 
5 1'echantillon a tester, dans une perspective prophylactique, diagnostique ou therapeu- 
tique, comme par exemple: la detection precoce d'une modification de I'expression 
d'une des sequences, dans une cellule, un tissu ou un organisme, 1' identification d'une 
sequence associee a une susceptibilite ou a une pathologie quelconque, le suivi de 
1'evolution de la pathologie, ou encore le suivi d'un traitement et revaluation de son 
10 efficacite. 

En dehors des applications deja enoncees, Tinteret de la methode 
permet, d'une maniere plus generate, de faire un biian des variations constatees chez 
un individu, ce qui constitue en quelque sorte une carte d'identite, ce qui facilite une 
approche epidemiologique permettant d'etablir de nouvelles correlations entre un 
1 5 profil particulier observe et une pathologie, en dehors de tout a priori concernant cette 
pathologie. 

La presente invention a egalement pour objet un kit de detection 
et/ou devaluation d'une maladie auto-immune et notamment des neuropathologies a 
etiologie auto-immune, caracterise en ce qu'il comprend outre les tampons necessaires 
20 a la mise en oeuvre des procedes tels que definis ci-dessus : 

- des reactifs A de diagnostic tels que definis ci-dessus, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d J un facteur, dont la fonction, la regula- 
tion/deregulation ou P alteration est associee a I'expression normale ou pathologique 

25 ou k la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Pune des extremites ne peut se trouver a une distance 
excedant 120 kb, 

30 lesquels reactifs sont de preference fixes sur un support approprie. 

Selon un mode de realisation avantageux dudit kit, lesdits reactifs B 
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sont selectionnes dans le groupe constitue par les sequences SEQ ID NO:62-67 et 1 19 
et leurs Augments correspondant a un cadre glissant superieur ou egal a 14 nucleotides 
ou leurs sequences complementaires, ainsi que les sequences representees aux figures 
13-17,22-26. 

5 La presente invention a egalement pour objet des produits de traduc- 

tion, caracterisSs en ce qu'ils sont codes par une sequence nucleotidique telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un peptide, caracterise 
en ce qu f il est susceptible d'etre exprime a l'aide d'une sequence nucleotidique selec- 
10 tionnee dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28 et 61, telles 
que definies ci-dessus, selon les combinaisons offertes par P usage des differents 
cadres de lecture possibles (voir egalement figures 18-21). 

Ledit peptide englobe egalement les peptides ou polypeptides deri- 
ves comprenant entre 5 et 540 aminoacides (SEQ ID NO:23-36 et SEQ ID NO:58 et 
15 leurs fragments d'au moins 5 aminoacides) et notamment un fragment de 538 amino- 
acides, commen9ant & la premiere methionine de la sequence SEQ ID NO:26 (enve- 
rine). 

Selon un mode de realisation avantageux desdits peptides, ils sont 
notamment selectionnes parmi les sequences SEQ ID NO:23-36, 58, notamment la 
20 sequence SEQ ID NO:26 et ses fragments C-terminaux } soit a partir de I'acide amine 
291, soit a partir de l'acide amine 321, & compter de la premiere methionine. 

Selon un autre mode de realisation avantageux desdits peptides, ils 
sont obtenus a partir des sequences nucleiques telles que definies ci-dessus, dans 
lesquelles au moins un codon non-sens peut etre remplace par un codon codant pour 
25 l'un des aminoacides suivants : Phe (F), Leu (L), Ser (S), Tyr (Y), Cys (C), Trp (W), 
Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly (G). 

L'invention englobe ainsi les peptides deduits ou les proteines 
d^duites correspondant a tout ou partie des sequences nucleiques decrites dans 
l'invention, et presentant eventuellement des modifications avec les sequences de refe- 
30 rences decrites dans l'invention, lorsqu'ils sont exprimes chez certains patients. En 
particulier, Tinvention englobe les sequences completes ou partielles obtenues selon 



WO 99/67395 



PCT/FR99/01513 



28 

les 3 cadres de lecture sens et les 3 cadres de lecture inverses et complementaires. 
(voir figures 18-21) 

De maniere avantageuse, ['analyse de la structure du domaine env de 
HERV-7q, appele enverine, a permis de mettre successivement en evidence: 
5 - un peptide signal N-terminal (region 1- 21) et deux domaines 

transmembranaires (region 320-340; 455-477), responsables d ; interactions avec des 
motifs proteiques ou lipidiques membranaires, 

- un motif immunomodulateur de type CKS-17(Haraguchi et coll., 
(1995), 92, 5568- 5571)/ CKS-25. On peut noter a cet egard, la presence d'un motif 

1 0 RalD a Pinterieur du peptide de type CKS-1 7/CKS-25 de HERV-7q et un motif RvaD 
en position 363 qui correspondent au consensus W/RxxD, propose pour le site actif 
des TGF-P (Huang et aL, J. Biol. Chem., 1997, 272, 27155- 27159), de puissants 
facteurs associes a la croissance, a la differentiation et a la morphogenese et qui sont 
associes a de nombreuses pathologies humaines, comme les processus turaoraux 

15 (Tang et coll., (1998), Nat. Med., 4, 802- 807) ou les maladies neurodegeneratives 
(Flanders et coll., (1998), Prog. Neurobiol., 54, 71- 85). Les peptides selon Pinvention 
contenant ces motifs peuvent avantageusement servir d'antagonistes en inhibant la 
fixation des TGF- p sur leurs recepteurs naturels. 

- des motifs de N-glycosylation. La glycosylation des proteines 
20 d'enveloppe des retrovirus semble etre directement associee a leurs proprietes fonc- 

tionnelles, par exemple en influen^ant le nombre des determinants disponibles dans les 
cellules-T ou en favorisant la reconnaissance des antigenes par les celluIes-T. La 
glycosylation pourrait jouer un role dans la declaration ou 1'extension d'une pathoio- 
gie a incidence autoimmune. Les glycosylations sont necessaires au maintien de la 
25 conformation de certains epitopes, en particulier lors de la realisation d'une proteine 
d'enveloppe recombinants a fin de mise au point d'un reactif de diagnostic et pour 
favoriser Pefficacite d'un eventuel vaccin. Positions 171, 210, 216, 236, 244, 283 et 
411. Nombre prevu au hasard : 3.2 

- des sites de prenvlation . La prenylation est un mecanisme essentiel 
30 de la fixation a la membrane cellulaire et pour le ciblage de certaines proteines. Ce 

processus de ciblage pourrait etre essentiel pour i'elaboration d'agents therapeutiques 
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specifiques aptes a interferer dans la realisation et la regulation du trafic de complexes 
cellulaires mettant en jeu des proteines impliquees dans les interactions, la croissance 
et les mouvements cellulaires. Positions 188 et 290. Nombre prevu au hasard : 1.8 

- des sites de ciblage dans le reticulum endoplasmique . Ces sites 
5 permettraient d'assurer le ciblage vers le reticulum endoplasmique afin d'effectuer les 
modifications necessaires pour favoriser le franchissement membranaire. Positions 
353 et 43 1 . Nombre prevu au hasard : 0.2. 

Par ailleurs, les Inventeurs ont montre qu'un certain nombre de 
peptides issus de la proteine env de HERV-7q (enverine) presentent une affinite/demi- 
10 vie elevees pour des alleles HLA de classe I. Une analyse par CADD a permis de 
selectionner des peptides candidats, dont les meilleurs scores sont indiques dans le 
Tableau I: 

TABLEAU I 
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locali- 


sequence 


molecule HLA 


score 


Sequence n° 






sation 


















399 


FLGEECCYYV 


A-0201 


7214 


SEQ 


ID 


NO 


:68 




462 


LLFGPCIFNL 


A-0201 


1792 


SEQ 


ID 


NO; 


:69 


20 


189 


CLPLNFRPYV 


A-0201 


1453 


SEQ 


ID 


NO; 


:70 




439 


GLLSQWMPWI 


A-0201 


488 


SEQ 


ID 


NO; 


:71 




263 


CLPSGIFFV 


A-0201 


5103 


SEQ 


ID 


NO; 


:72 




444 


WMPWILPFL 


A-0201 


897 


SEQ 


ID 


NO; 


:73 




252 


IRWVTPPTQI 


B-2705 
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SEQ 


ID 


NO; 


:74 


25 


432 


LRNTGPWGLL 


B-2705 


2000 


SEQ 


ID 


NO: 


:75 




158 


LRTHTRLVSL 


B-2705 


2000 


SEQ 


ID 


NO: 


:76 




316 


KRVPILPFVI 


B-2705 


1800 


SEQ 


ID 


NO: 


:77 




25 


CRCMTSSSPY 


B-2705 


1000 


SEQ 


ID 


NO: 


:78 




137 


TRVHGTSSPY 


B-2705 


1000 


SEQ 


ID 


NO: 


;79 


30 


124 


AREKHVKEVI 


B-2705 
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SEQ 


ID 


NO: 


;80 




478 


SRIEAVKLQM 


B-2705 


600 


SEQ 


ID 


NO: 


;81 




442 


SQWMPWILPF 


B-2705 


500 


SEQ 


ID 


NO: 


82 




405 
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Kd 


2400 


SEQ 


ID 


NO: 


;83 




346 


FYYKLSQEL 


Kd 


2400 


SEQ 


ID 


NO: 


84 


35 
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TYTTNSQCI 


Kd 


2400 


SEQ 


ID 


NO: 


85 
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Kd 
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SEQ 


ID 


NO: 


86 




406 


YYVNQSGIV 


kd 


1200 


SEQ 


ID 


NO: 


87 
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LFNTTLTGL 


Kd 


1152 


SEQ 


ID 


NO: 


88 




463 


LFGPCIFNL 


Kd 


960 


SEQ 


ID 


NO: 


;89 


40 


253 


RWVTPPTQI 


Kd 


480 


SEQ 


ID 


NO: 


90 




449 


LPFLGPLAAI 


B-5102 
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SEQ 


ID 


NO: 


;91 




3 
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B-5102 
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SEQ 


ID 


NO: 


92 
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TABLEAU I (suited 
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Sequence n° 
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10 
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Kd 
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Kd 
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Tn 
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Kd 
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ID 
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Kd 
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ID 


NO: 
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221 
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B-5102 
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SEQ 


ID 


NO: 
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LPLNFRPYV 


B-5102 
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SEQ 


ID 


NO: 


108 




449 


LPFLGPLAAI 


B-5101 


1144 


SEQ 


ID 


NO: 


109 




488 


EPKMQSKTKI 


B-5101 


968 


SEQ 


ID 


NO: 


110 


25 


3 


LPYHIFLFTV 


B-5101 


629 


SEQ 


ID 


NO: 


111 




125 


REKHVKEVI 


Kk 


1000 


SEQ 


ID 


NO: 


112 




312 


KPRNKRVPIL 


B7 


800 


SEQ 


ID 


NO: 


113 




378 


WLQNRRAL 


Db 


792 


SEQ 


ID 


NO: 


114 




377 


AWLQNRRAL 


Db 


660 


SEQ 


ID 


NO: 


115 


30 


321 


LPFVIGAGV 


B-5101 


629 


SEQ 


ID 


NO: 


116 




304 


DLYSYVISK 


A3 


540 


SEQ 


ID 


NO: 


117 




301 


TEQDLYSYVI 


Kk 


500 


SEQ 


ID 


NO: 


118 



Ce Tableau I indique une estimation de la demi-vie de dissociation 
35 d'un peptide de Fenverine avec un allele du systeme HLA de classe I (les tables de 
coefficients de Parker: J. Immunol, (1994), 152, 163- 175). La localisation indique la 
position du premier acide amine des peptides testes dans la sequence de renverine. Le 
code a une lettre est utilise pour la sequence des acides amines. Les scores autour de 
500 ou superieurs i 500 ont &e retenus. A titre de comparaison, une analyse a ete 
40 effectuee sur une concatenation de peptides (polypeptide de 4968 acides amines) 
reputes pour fixer les molecules du complexe majeur d'histocompatibilite de classe 1 
(Rammensee, Immunogenetics, (1995), 41, 178- 228): les dix meilleurs scores enre- 
gistres pour des nonapeptides et le type HLA, A_0201 sont respectivement de 4984, 
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4047, 2406, 1267, 800, 705, 607, 591, 591 et 577. 

II ressort de ce Tableau I que certaines molecules du complexe 
majeur d'histocompatibilite de type I sont aptes a fixer des peptides issus de 
l'enverine, ainsi assimiles a des peptides d'origine virale ou tumorale, au niveau du 
5 reticulum endoplasmique. Les complexes formes au niveau du reticulum endo- 
plasmique sont alors transports a la surface cellulaire, ce qui entraine la destruction 
de la cellule cible par les lymphocytes-T cytotoxiques. Les peptides identifies 
component generalement 8 a 10 acides amines. Des etudes ont montre que certains 
alleles du systeme HLA de classe I sont ainsi associees a cenaines pathologies, en 

10 particulier a caractere auto-immun, comme HLA-B27 avec la spondylarthrite ankylo- 
sante ou HLA-B5 1 avec la maladie de Behset. 

Un peptide apte a fixer une molecule particuliere de classe I est par 
consequent apte a fonctionner comme un epitope de cellule-T. 

En consequence, la presente invention inclut egalement les 

15 fragments 399-471 et 244-271 de l'enverine qui regroupent avantageusement plusieurs 
epitopes de forte affinite pour differents haplotypes du systeme HLA de classe I. 
L' usage de tout ou partie de ces polypeptides est en consequence apte a favoriser une 
augmentation du repertoire des cellules-T, en permettant une meilleure efficacite de la 
reponse immunitaire dans le cadre des differentes strategies immunotherapeutiques, 

20 prophylactique ou vaccinales). Ces peptides pourront etre avantageusement delivres 
par exemple par 1'usage, de vecteurs viraux, de particules virales ou synthetiques, de 
lipopeptides, d'adjuvants ciassiques, d'acides nucleiques nus ou adsorbes sur des 
particules, ou de liposomes. 

Au sens de la presente invention, les peptides peuvent etre chimi- 

25 quement ou biochimiquement modifies ; certaines des acides amines peuvent etre 
remplaces par un acide amine analogue, selon les criteres ciassiques d'homologies (A 
ou G ; S ou T ; I, L ou V ; F, Y ou W ; N ou Q ; D ou E). 

La presente invention a egalement pour objet des compositions 
immunog^nes ou vaccinales, pour la protection contre les maladies auto-immunes, 

30 notamment chez les sujets a risque, caracterisee en ce qu'elle comprend au moins un 
peptide comprenant au moins un motif de type CKS et/ou au moins un peptide 
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constitue par un motif presentant une affinite avec Tun des haplotypes du systeme 
HLA de classe I ou de classe II et un vehicule pharmaceutiquement acceptable. 

Selon un mode de realisation avantageux de ladite composition, ledit 
motif est selectionne dans le groupe constitue par les peptides tels que definis dans le 
5 Tableau I ci-dessus. 

Selon un autre mode de realisation avantageux de ladite composi- 
tion, ledit peptide presente la sequence suivante : 

sequence CKH: LONRRALDLLTAERGGT clFLGEECCYYV 
(SEQ ID NO: 120). 

10 II est remarquable de constater au niveau de la position 380 de la 

proteine enverine, la contiguTte des motifs de type CKS-17 (souligne) et du peptide 
presentant le score le plus eleve (en gras ; voir peptide en position 399 dans le Tableau 
I, SEQ ID NO:68) dans la sequence CKH. 

L'activation clonale des sous-groupes de lymphocytes, par exemple 

15 de lymphocytes cytotoxiques, par les peptides du Tableau I et par extension leurs 
homologues, est bloquee par des manoeuvres usuelles d'immunotherapie comme par 
exemple la serotherapie et la vaccination. 

L* association de deux sequences ou des sequences analogues au 
peptide CKH (SEQ ID NO: 120), est a meme d'entrainer un processus synergique dans 

20 la reponse immunitaire, qui pourrait mettre en jeu des voies de signalisation et 
d'activation complementaires, aptes a moduler Tactivation lymphocytaire. 

La vaccination concerne la production d'anticorps diriges contre les 
peptides du tableau I, selon les regies de Tart et selon les methodes de liberation 
controlees par implants artificiels ou cellulaires mettant en oeuvre une composition 

25 telle que definie ci-dessus et par usage des manoeuvres de therapie genique, comme 
par exemple par expression des sequences nucleiques codant pour les peptides du 
Tableau I. En consequence T invention a egalement pour objet des compositions 
immunog£nes ou vaccinale caracterisee en ce qu'elles comprennent un vecteur 
incluant au moins une sequence nucleique codant un peptide tel que defini dans le 

30 Tableau I, eventuellement associee a une sequence codant un motif de type CKS- 1 7. 

La serotherapie concerne l'utilisation d'anticorps neutralisants 
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produits a partir des peptides du Tableau I et leurs homologues. 

Les produits proteiques generes par les sequences retrovirales endo- 
genes ou produits parallelement peuvent avantageusement etre caracterises par des 
micro-methodes d'analyse et de quantification des peptides et des proteines: 
5 HPLC/FPLC ou equivalent, electrophorese capillaire ou equivalent, techniques de 
microsequen9ages (methode d'Edman ou equivalent, spectrometrie de masse...). 

L'invention a egalement pour objet des anticorps diriges contre Tun 
ou plusieurs des peptides decrits ci-dessus et leur utilisation soit pour la mise en ceuvre 
d'une methode de detection in vitro, notamment differentielle de la presence d'une 
10 telle sequence chez un individu, soit pour la preparation d'une composition apte a etre 
utilisee en serothSrapie dans les neuropathologies a composante auto-immune. 

Lesdits anticorps sont avantageusement des anticorps polyclonaux 
ou monoclonaux obtenus par une reaction immunologique d'un organisme humain, 
mammiferes, oiseaux ou autres especes vis-a-vis des proteines, telles que definies ci- 
15 dessus. 

La presente invention a pour objet un precede de depistage 
immunologique differentiel de sequences retrovirales endogenes humaines de la 
famille HERV-7q normales ou pathologiques, caracterise en ce qu'il comprend la mise 
en contact d'un dchantillon biologique avec un anticorps selon l'invention, la lecture 
20 du resultat etant revelee par un moyen approprie, notamment EIA, ELISA, RIA, 
fluorescence. 

A titre d'illustration, une telle methode de diagnostic in vitro selon 
l'invention comprend la mise en contact d'un echantillon biologique preleve chez un 
patient, avec des anticorps selon l'invention et la detection a l'aide de tout procede 

25 approprie, notamment a l'aide d'anti-immunoglobulines marquee, des complexes 
immunologiques formes entre les proteines produites normalement ou pathologique- 
ment et les anticorps. 

Des anticorps monoclonaux ou polyclonaux, produits a partir 
d'antigenes correspondants a des peptides de synthese, de polypeptide ou proteines 

30 recombinants, permettent de suivre 1'expression des peptides ou proteines produits 
normalement ou pathologiquement. L'analyse est de preference effectuee par ELISA, 
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ou equivalent, Western-blot ou equivalent, ou par immunohistochimie. 

Les peptides ou proteines, issus des sequences retrovirales endo- 
genes ou dont T expression est associee a T expression de ces sequences retrovirales 
endogenes, sont recherches et identifies. 
5 La presente invention a egalement pour objet un procede ^identifi- 

cation et de detection de motifs retroviraux endogenes, anormalement exprimes dans 
le cadre de pathologies associees au cancer, ou de neuropathologies en particulier 
auto-immunes, au premier rang desquelles la sclerose en plaques, caracterise en ce 
qu'il comprend l'analyse comparee des sequences extraites d'un echantillon biologique 

10 avec les sequences selon Tinvention. 

La presente invention a egalement pour objet Implication des 
sequences nucleiques ou des sequences proteiques selon Tinvention au diagnostic, au 
pronostic, a T evaluation de la susceptibilite genetique, a toutes maladies humaines 
induites, innees ou acquises en particulier celles a composantes cancereuses, auto- 

15 immunes et/ou a incidence neurologique, comme la sclerose en plaques, les 
syndromes associes et les maladies neurodegeneratives oil intervient tout ou partie des 
sequences nucleiques selon Tinvention et des formes endogenes ou exogenes appa- 
rentees. 

La presente invention a egalement pour objet des sequences 
20 nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
nucleiques selon Tinvention, combines avec des sequences ou motifs d'origine endo- 
gene ou d'origine ou induits de maniere exogene. 

La presente invention a, en outre, pour objet un vecteur recombinant 
de clonage ou d'expression, caracterise en ce qu'il comprend une sequence nucleique 
25 conforme a Tinvention. 

Des manoeuvres therapeutiques peuvent etre envisagees par usage de 
certaines des sequences nucleiques contenues dans HERV-7q et les sequences de la 
meme famille ou des structures polypeptidiques deduites ou par utilisation de peptides 
ou proteines, ou d'anticorps specifiques. 
30 Conformement a Tinvention, tout ou partie des sequences nucleiques 

retrovirales endogenes de type HERV-7q, peut etre utilisee a usage de vecteur ou 
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d'elements de vecteurs a vocation therapeutique, en particuiier les sequences LTR et la 

region gag (SEQ ID NO :2, 2 1 et 22). . 

L'interet de telles sequences reside, dans Tinnocuite du vecteur ainsi 

forme, dans la possibility d'une insertion specifique ciblee dans une region bien defi- 
5 nie par une strategic analogue a la recombinaison homologue, dans le ciblage cellu- 

laire, eventuellement transitoire dans le cas d'une expression placentaire chez la 

femme. Un autre aspect conceme la possibility d'associer aux genes d'interets les 

motifs retroviraux biologiquement actifs (peptides immunomodulateurs, tels que 

representes aux sequences SEQ ID NO 68-1 18, ci-apres, peptide fusogene...). 
10 La presente invention a egalement pour objet des animaux 

transgeniques, caracterises en ce qu'ils comprennent tout ou partie d'une sequence de 

type HERV-7q (SEQ ID NO:l-22 et 61). 

Le Tableau II ci-apres etablit les correspondances entre les numeros 

des sequences telles qu'elles apparaissent dans la liste de sequences et le nom des 
1 5 difFerentes sequences. 

TABLEAU II 



SEQ ID NO : 


DESIGNATION 


1 


Acide nucleique 


7 env 


2 


Acide nucl&que 


gag 


3 


Acide nucleique 


HERV-7q 


4 


Acide nucleique 


HE2 


5 


Acide nucleique 


HE3 


6 


Acide nucleique 


HG3 


7 


Acide nucleique 


HE4 


8 


Acide nucleique 


HE5 


9 


Acide nucleique 


HE6 


10 


Acide nucleique 


HG6 


11 


Acide nucleique 


HE7 


12 


Acide nucleique 


HE8 


13 


Acide nucleique 


HG8 


14 


Acide nucleique 


HE9 


15 


Acide nucleique 


HE10 


16 


Acide nucleique 


HE11 


17 


Acide nucleique 


HG11 


18 


Acide nucleique 


HE12 


19 


Acide nucleique 


HG12 
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Ofi 
ZU 


Acide nucieique : Rl 


Zl 


Acide nucleique : R1F 


zz 


Acme nucieique + proteine env aeauue . riiiiv v - / q 


01 

Zj 


fragment ae proieme env aeauue seion any id .zz 


O/i 
Z*t 


fragment ue proicine env aeauue seion oeajj lu iskj .zz 


Z> 


fragment ae proteine env aeauue seion *— ^ 


o/; 
zo 


Proteine envenne 


27 


Fragment de proteine env deduite seion SEQ ID NO :22 


Oft 
Zo 


Aciae nucieique + proteine aeauue ae gag . rinKv- /q 


00 

Z7 


Uro rrrvt ant rla nrAtpmA fro fr rtori 1 Mtf* ct* lrtn TTi Mil *0R 

rragmeni ue proicine gag ucuuiie aciuu ocy i j_/ inv-/ .zo 


in 


Cironmont /-J nrnf 01 t"i A norr /1 ei/H 1 1 1 1<> CPl/tfl ^ m II TTi Mil *0R 

fragment ae proieine gag aeauue seion olzki lu inu -zo 




Fragment ae proicine gag ucuuiie bciun oLy lu i»u .zo 


10 
JZ 


rragmeni ae proicine gag ucuuiie aciuu oilv^ lu in vy .zo 




T«rorrm<»rtt H a rtT*rt+PinP fta ft HpHllltP colon Q T« f"^ IFl "Wfi *0ft 

rragmeni ae pruLcine gag ucuuiie aciun ocy iu in w .^o 


14 


Prarrmpnt' Hp nrntptnp ono H**Hnit^ Qplon ^FH TD MO *08 


15 


1 roieme env . caure ue icuiurc i 


JO 


r ruicuic gag 


17 


Ar*i/1*» niiplpiniip • /^x 1 T^" rainr^rr'P^ 

Aviue nuLiciu^uc . uir ^aiiiun-.c^ 


18 

JO 


ACiae nucieique . vjiiv ^ainurwc^ 


1Q 


A/^IHp nitnlpiniiA • rrOT* (amf\TPp\ 
AC1UC I1UU1C11|IIC . vJZF ^alHUlL-C^ 


AH 


Aciae nucieique . vjziv ^amorce^ 


41 

*T 1 


aciuc nucieique . vjrtr ^ajiiurL-c^ 


40 
*fZ 


Aciae nucieique . ujr ^ amorce j 


41 


ACiue nucieique . vjhiv ^amorce ) 


/Id 


Aciae nucieique . ojiv ^amorce^ 


45 


Aciae nucieique . n 1 r ^amorce j 


AA 


Aciae nucieique . cii\ (amorce ) 




Acide nucieique : E2F (amorce) 


4ft 


Aciae nucieique . nziv ^amorcej 


4Q 


Aciae nucieique . cjr ^ amorce^ 


5fi 


Aciae nucieique . hjiv ^amorce ) 


<i 

j i 


rVLriue nucieique . j^Hr ^cuiiurue^ 


59 


ACiue nuwiciijuc . chf*. ^ainurucy 


51 


Aeiue nucieique . cjr ^amorce j 


54 


Acide nucleiaue * E6F famorce^ 

11 VI1IW llUwlvi\JUv * ^^vX I U1IIV1 vv 1 


55 


Acide nucieique : E5R (amorce) 


56 


Acide nucieique : ExF (amorce) 


57 


Acide nucieique : ExR (amorce) 


58 


Proteine gag 


59 


Acide nucieique : Sequence A (sequence d'insertion) 


60 


Acide nucieique : Sequence B (sequence d'insertion) 


61 


Acide nucieique : HE 13 


62 


Acide nucieique : RH7 
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atL\l iU riKJ. 




LFlLoivrPfA 1 iUii 


63 


Acide nucleique 


KAM / j 


64 


Acide nucleique 


RAV/j 


65 


Acide nucleique 


RBP3 


66 


Acide nucleique 


HIj 


67 


Acide nucleique 


LTX 


68 


Peptide Tableau 1 




69 


Peptide Tableau J 




70 


Peptide Tableau ] 




71 


Peptide I ableau J 




TO 


Peptide Tableau 3 




/J 


Peptide Tableau ] 




/4 


Peptide Tableau ] 




7< 


Peptide Tableau ] 




7/£ 
/O 


Peptide Tableau ] 




77 

/ / 


Peptide Tableau ] 




78 
/o 


repnoe xaoieau i 




70 


Peptide Tableau ] 




ou 


reptiae laoieau j 




o 1 


reptiae i aoieau i 




OZ 


reptiae i aoieau j 




OJ 


repuoe i aoieau j 




0/1 

o4 


Peptide Tableau 1 




OC 
OJ 


Peptide Tableau ] 




OjC 
00 


Peptide Tableau ] 




0/ 


Peptide Tableau 1 




oo 

00 


Peptide Tableau ] 




o9 


r eptiae l ableau l 




90 


Peptide Tableau I 




m 
91 


Peptide 1 ableau J 




92 


Peptide Tableau I 




Ol 

93 


T) u ^! TaLI aai> 1 

Peptide 1 ableau J 




y4 


reptiae l ableau l 




so 


Peptide Tableau 1 




9u 


Peptide Tableau 1 




97 


PpnriH^ Tahlpmi 1 
r cpuuc i auiwau i 




98 


Peptide Tableau I 




99 


Peptide Tableau I 




100 


Peptide Tableau 1 




101 


Peptide Tableau I 




102 


Peptide Tableau I 




103 


Peptide Tableau 1 




104 


Peptide Tableau I 




105 


Peptide Tableau ] 
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106 


rCpilUC 1 aUtCaU 1 






1 fi7 
1U / 


Peptide Tableau I 




reptiae 1 ableau 1 


i no 


Peptide Tableau I 


1 1U 


reptiae i ableau I 


1 1 1 


Peptide Tableau 1 


1 1 0 
1 1Z 


Peptide Tableau I 


111 


Peptide Tableau I 


1 14 


rcuiiuc i auitau 1 


115 


Peptide Tableau I 


116 


Peptide Tableau I 


117 


Peptide Tableau I 


118 


Peptide Tableau I 


119 


Acide nucleique : BLIMP- 1 


120 


Peptide : CKH 


121 


Acide nucleique : F645 (amorce) 


122 


Acide nucleique : PS5D (amorce) 



Outre les dispositions qui precedent, r invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre du procede objet de la presente invention ainsi qu'aux 
5 dessins annexes, dans lesquels : 

- Figure 1. Sequence nucleique humaine HERV-7q, dont l'analyse et 
le traitement permettent de caracteriser une nouvelle structure retrovirale endogene. 
Les regions nucleiques repetees de type Rl et R2 et les domaines gag, pol et env sont 
soulignes. Les domaine de type gag et env sont en italiques. La region homologue a 

10 une partie 3' non-codante de Rab7 est doublement soulignee. 

- Figure 2. Cartographie de la region retrovirale endogene humaine 
HERV-7q. La partie haute de la figure correspond a une region anonyme du genome 
humain situee sur le bras long du chromosome 7. On peut identifier les domaines 
repetes (1), gag (2), pol (3) et env (4) de HERV-7q. La region env C-terminale (4.3) se 

15 prolonge en amont en un long cadre de lecture ouvert (4.2). Le domaine 4.1, corres- 
pond a la region N-terminale du domaine env. 

- Figure 3. Comparaison des sequences nucleiques repetees situees 
aux bornes de HERV-7q. Les regions nucleiques repetees S'(haut) et 3'(bas), sont 
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comparees et les bases identiques sont indiquees par deux points. 

- Figure 4. Sequence deduite presentant un cadre de lecture ouvert. 
dans le domaine de type-env de HERV-7q selon la regie du plus long cadre de lecture 
ouvert. 

5 - Figure 5. Sequences autour du domaine CKS-17 identifiees dans 

differents domaines env deduits de la famille de HERV-7q et comparaison avec des 
motifs CKS-17 de reference. 

1) HE2 - 2) HERV-7q - 3) N° d'acces a GenBank: M85205 - 4) 
HE7 - 5) HE9 - 6) CKS-17: le motif peptidique doue de proprietes immunomodula- 
1 0 trices est souligne - 7) gp20 de retrovirus de type-D (SRV-Pc). 

- Figure 6. Sequence deduite possible du domaine de type-gag iden- 
tified dans HERV-7q etablie selon la regie du plus long cadre de lecture ouvert. X et / 
correspondent respectivement a un codon non-sens et a un decalage de cadre de 
lecture. La sequence soulignee correspond au debut du domaine pol. 

15 - Figure 7. Comparaison des regions nucleiques couvrant la region 

gag de HERV-7q (haut) et HERV-TcR (bas) et leurs regions flanquantes. Les bases 
identiques sont specifiees par deux points. 

- Figure 8. Exemple d'alignements nucleiques du domaine de type 
env de HERV-7q avec des domaines de type env similaires presents dans des 

20 sequences retrovirales endogenes humaines de la meme famille. Les codons non sens 
sont soulignes : 1) HERV-7q - 2) HE2 - 03) HE3 - 04) HE4. 

- Figure 9. Alignements nucleiques entre le domaine gag de HERV- 
7q et les domaines correspondants appartenant a la meme famille. Comparaison avec 
des fragments de domaines gag isoles d'agents retroviraux infectieux. Sequences 

25 d'origine retrovirale infectieuse: N° d'accession dans la banque de donnees EMBL : 
1 ) A60 1 68 - 2) A6020 1 - 3) A60200 - 4) A60 1 7 1 . Sequences retrovirales endogenes 
humaines: 5) HERV-7q - 6) HG1 1 - 7) HG3. Les chiffres indiques dans les sequences 
endogenes, correspondent au nombre de nucleotides inseres afin d'optimiser 
Falignement avec les sequences de type gag identifiees dans des retrovirus d'origine 

30 infectieuse. 

- Figure 10. Alignement d'un motif gag proteique deduit (haut) 
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appartenant a un retrovirus infeclieux (N° d'accession EMBL : A60200) avec le motif 
gag proteique deduit (bas) identifie dans HERV-7q. Les codons non-sens sont en gras 
et soulignes. Les acides amines identiques sont specifies par 2 tirets. Un tiret indique 
une deletion ou un acide amine homologue. 
5 - Figure 11. Alignement d'un motif env (haut) appartenant a un 

retrovirus infectieux (N° d'accession EMBL : A60170) avec le motif env (bas) identi- 
fie dans HERV-7q. Les nucleotides homologues sont specifies par deux points et les 
deletions par un tiret. 

- Figure 12. Comparaison entre le domaine env de HERV-7q (haut) 
10 et le domaine env de HERV-9 (bas). L'homologie de 66 % se limite a la region 3 ? du 

domaine env de HERV-7q et HERV-9, respectivement entre les nucleotides 8976 nt et 
9500 nt de HERV-7q et les nucleotides 2898 nt et 3465 nt de HERV-9 (N° 
d'accession a GenBank : X57147). De nombreuses insertions/deletions sont aussi 
observees. 

15 - Figure 13. Homologie entre une partie de la sequence du transcrit 

codant pour RH7 (haut, SEQ ID NO:62) et un motif de RGH2 (bas - N° d'accession a 
GenBank: D11018). 

- Figure H. Identification de la sequence du transcrit codant pour 
RAM75 (SEQ ID NO:63), correspondant au gene d'une ATPase de type PEX1. Les 

20 exons codants sont soulignes. Les codons d'initiation et non-sens ainsi que les sites 
putatifs de polyadenylation sont en gras et soulignes. La region en italique correspond 
au debut de la sequence retrovirale endogene RH7. 

- Figure 15. Sequence du transcrit codant pour RAV73 (SEQ ID 
NO:64), situee a 0.7 kb en aval de HERV-7q ; les sequences nucleiques aptes a coder 

25 pour un ou plusieurs polypeptides sont soulignees. 

- Figure 16. Comparaison entre la sequence LTR 3 ? (haut) de 
HERV-7q et la sequence intronique LTX (SEQ ID NO:67), situee dans le gene FMR2, 
associe au X-firagile (bas). 

- Figure 17. Mise en evidence de modifications sur la sequence 
30 nucleotidique (ID NO:3), chez des patients atteints de SEP. Les bases modifiees, chez 

au moins un patient, sont soulignees. Les amorces utilisees sont en italiques 
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(sequences SEQ ID NO: 121 et 122). L'ATG cTinitiation et le codon non-sens sont en 
gras. 

- Figure 18. Partie codante env de la sequence HERV-7q (sequence 
ID NO:3), avec 3 cadres de lecture. 

5 - Figures 19, 20, 21. Presentation separee de la proteine env selon les 

3 cadres de lecture. 

- Figure 22. Sequence nucleique contenant la sequence retrovirale 
RH7 situee en 5' de la sequence HERV-7q. La sequence en italique correspond au 
debut de la sequence HERV-7q. La sequence RH7 est soulignee. Deux sites de poly- 

1 0 adeny lation putatifs sont gras. 

- Figure 23. Sequence du transcrit codant pour RBP3 contenant des 
motifs nucleotidiques identifies dans la sequence nucleique codant pour le gene 
Blimp- 1. 

- Figure 24. Sequence du transcrit codant pour APS. 

15 - Figure 25. Sequence du transcrit codant pour Blimp- 1 ; la partie 

codante est soulignee ; les codons d'initiation et de terminaison sont en gras. 

- Figure 26. Sequence du transcrit codant pour FMR2. La partie 
codante est soulignee. Les codons d'initiation et non-sens sont en gras. 

II doit etre bien entendu, toutefois. que ces exemples sont donnes 
20 uniquement a titre d'illustration de l'objet de 1'invention, dont ils ne constituent en 
aucune maniere une limitation. 

EXEMPLE 1 : Detection, par amplification genique, d'une sequence nucleique 
appartenant k un domaine de type gag ou env seion I'invention, dans un echan- 
tillon d'AJDN genomique d'origine humaine ou de mammiferes. 

25 L'amplification genique s'effectue a partir d'ADN genomique isole 

a partir du sang. Un traitement anticoagulant est effectue avec 1 ml d'une solution de 
citrate (pour un litre : 4,8 g de d'acide citrique, 13,2 g de citrate de sodium, 14,7 g de 
glucose) pour 6 ml de sang frais. Apres centrifugation de 20 ml de sang pendant 15 
mn a 13.0000 g t le sumageant est elimine et la fraction enrichie en globules blancs est 
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transferee dans un nouveau tube, puis recentrifugee dans les memes conditions que 
precedemment. La fraction enrichie en globules blancs est resuspendue dans un 
tampon d'extraction (10 nm Tris-HCl, 0,1 M EDTA, 20 ng/ml de RNAse pancreatique 
traitee afin d'eliminer les DNAses, 0,5 % SDS, pH 8.0) ; puis incubee pendant 1 heure 
5 a 37°C. La proteinase K est ajoutee a une concentration finale de 100 ^ig/ml. La 
suspension des cellules lysees est incubee a 50°C durant 3 heures sous agitation perio- 
dique, puis traitee par un volume egal de phenol equilibre par du Tris-HCl 0.5 M, pH 
8,0. L'emulsion formee est placee sur une roue pendant une heure. puis centrifugee a 
5000 g pendant 15 mn a temperature ambiante. La solution aqueuse est traitee depro- 

10 teinise par une triple extraction phenolique afin d'obtenir un niveau de purification 
correspondant a un rapport final d'absorbance A260/A280 superieur a 1.75. La frac- 
tion aqueuse est precipitee par 0,2 vol. d'acetate de sodium 10 M et 2 vol. d'ethanol. 
L'ADN est alors soit preleve avec 1'extremite d'une pipette pasteur recourbee. soit 
centrifuge a 5000 g pendant 5 mn a temperature ambiante. L'ADN ou le culot d'ADN 

15 est lave deux fois par de l'ethanol a 70 %, puis repris dans 1 ml de TE pH 8,0 afin 
d'etre elue sous agitation douce pendant 12 a 24 heures. 

Des oligonucleotides specifiques des sequences endogenes decrites 
selon 1' invention sont choisis pour amplifier la region gag ou env des regions retro- 
virales endogenes decrites selon l'invention. L'ADN genomique etudie provient de 

20 patients presentant des pathologies comme la sclerose en plaques et d'individus repu- 
tes sains. 

Les ADN polymerases thermostables utilisees ont ete choisies pour 
leur grande fidelite lors du processus d'amplification, comme la Ventr ADN polyme- 
rase (Biolabs) ou equivalent, et sont utilisees selon les conditions preconisees par le 
25 fournisseur. 

La strategic d'amplification utilise selon les cas une simple PCR, ou 
une PCR nichee ou semi-nichee. 

Oligonucleotides utilises pour amplifier la region gag : 

- amorce GIF, sens, localisee dans la region amont du domaine gag 
30 de HERV-7q (SEQ ID NO:37), 

- amorce G1R, anti-sens, localisee dans la region 3* terminale du 



WO 99/67395 



PCT/FR99/01513 



43 

domaine gag (SEQ ID NO:38), 

Le fragment de 1505 nt amplifie par le couple G1F-G1R : 1505 nt 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 
5 - amorce G2F, sens nichee (SEQ ID NO:39) ? 

- amorce G2R, anti-sens nichee (SEQ ID NO:40) ? 

- amorce G4F, sens nichee (SEQ ID NO:41), 

- amorce G3F, sens nichee (SEQ ID NO:42). 

- amorce G4R, anti-sens nichee (SEQ ID NO:43), 
10 - amorce G5R, anti-sens nichee (SEQ ID NO:44) ? 

Oligonucleotides utilises pour amplifier la region env de HERV-7q : 

- amorce E1F, sens (SEQ ID NO:45) ? 

- amorce E1R, anti-sens (SEQ ID NO:46), 

Le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
15 est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 

- amorce E2F, sens (SEQ ID NO:47), 

- amorce E2R, antisens (SEQ ID NO:48), 

- amorce E3F, sens (SEQ ID NO:49), 

20 - amorce E3R, anti-sens (SEQ ID NO:50), 

- amorce E4F, sens (SEQ ID NO:51), 

- amorce E4R, anti-sens (SEQ ID NO:52), 

- amorce E5F, sens (SEQ ID NO:53), 

- amorce E6F, sens(SEQ ID NO:54) 
25 - amorce E5R(SEQ ID NO:55). 

- amorce ExF (SEQ ID NO:56) 

- amorce ExR (SEQ ID NO:57) 

La PCR est realisee a partir de 50 a 200 ng d' ADN genomique. Les 
conditions de PCR sont celles preconisees par le fournisseur. Les conditions cycliques 
30 d' amplification sont realisees dans 50 \i\ : une denaturation de 94°C pendant 1 min., 
une hybridation de 70°C pendant 1 min., et une elongation a 72 °C pendant 1 a 2 min., 
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selon les fragments amplifies. Apres 35 cycles, une reaction terminate est menee a 
72°C pendant 10 min. Le sequensage automatique des echantillons amplifies est rea- 
lise a Paide d'un sequenceur Applied Biosystems de type ABI 377 ou autre modele 
comparable, selon les protocoles fournis par le constructeur. 
5 Dans le cas d'une PCR nichee ou semi-nichee. les memes conditions 

experimentales sont utilisees, a la seule difference que Techantillon d'ADN geno- 
mique est remplace par 5 a 10 u.1 du produit d' amplification issu de la premiere PCR. 

Deux amplifications independantes sont realisees a partir du meme 
echantillon. Une reaction de controle est realisee en rempla9ant r echantillon d'ADN 
10 par de Teau afin de detecter d'eventuels contaminants. 

EXEMPLE 2 : Detection par amplification genique d'une sequence nucleique 
selon Pinvention dans un echantillon biologique d'ADN genomique preleve chez 
des patients presentant une pathologie candidate declaree ou la suspicion de cette 
pathologic 

15 Le protocole d'amplification est le meme que dans Texemple 1, mis 

a part I'origine de Fechantillon qui provient de patients presentant une pathologie 
candidate. Un echantillon d'ADN genomique repute normal est systematiquement 
integre dans Fensemble des echantillons pathologiques amplifies puis analyses. 

Les produits de PCR sont separes sur un gel d'agarose a 1,5 %, puis 

20 transferes en presence de soude 0,4 N sur une membrane de nylon charge. Une hybri- 
dation est realisee avec une sonde specifique correspondant aux fragments de PCR 
amplifies soit par les couples G1F-G1R soit par le couple E1F-E1R. La sonde est 
marquee par incorporation de dUTP-digoxygenine selon le protocole du fournisseur 
(Boehringer Mannheim). L'hybridation est effectuee dans un tampon d'hybridation 

25 (5XSSC, 50 % formamide, 0,1 % lauroyl-sarcosine, 0,02 % SDS ? 2 % de reactif de 
blocage Boehringer) pendant une nuit a 42°C. Le Southern est lave 2 fois 5 min. a 
temperature ambiante dans une solution de 2XSSC, 0,1% SDS. Puis un lavage a haute 
stringence est effectue a deux reprises pendant 15 min. a 55°C dans une solution 
0,1XSSC, 0,1 % SDS. L'hybridation est revelee selon le protocole du fournisseur 

30 (Boehringer Mannheim), en presence d'un substrat chimioluminescent de la phospha- 
tase alcaline, de type CSPD ou CDP-STAR. Le filtre est revele apres une exposition 
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de 15min. a 60 min. 

Une analyse par SSCP (" single strand conformation polymor- 
phism ") permet de detecter des modifications discretes de la sequence des fragments 
amplifies par PGR. La PCR est menee en presence de dCTP marques au P J2 . L'echan- 
5 tillon a analyser est denature a 95°C pendant 10 min., en presence de tampon de 
charge, puis immediatement charge sur un gel de polyacrylamide a 10%, contenant 
7.5% de glycerol. La migration s'effectue b 4°C a 8-10 W. Le gel est seche puis auto- 
radiographic. 

Les fragments de PCR susceptibles de presenter une alteration de 
10 leur sequence nucleotidique sont sequences selon 1'exemple 1 . 

Une hybridation a I'aide d'un oligonucleotide specifique (17 mers a 
20 mers) correspondant a la region nucleotidique modifiee permet d' identifier les 
echantillons presentant une modification identique (methode ASO). Brievement le 
southern est hybride avec un oligonucleotide marque distalement soit au P 3 \ soit en 
15 presence de digoxygenine (selon le protocole de Boehringer Mannheim) puis lave 
dans des conditions stringentes k 65%C dans une solution 6XSSC, 0.05% pyrophos- 
phate de sodium. 

Par exemple, un sequencage nucleotidique automatique a ete realise 
sur six fragments de PCR, provenant de 5 patients atteints de SEP et un temoin repute 

20 normal, et qui ont ete amplifies a partir des amorces F645 : 
CTTCAAACAACAACCAGGAGG (SEQ ID NO: 121) (situee a 26 nucleotides en 
amont de la methionine d'initiation de Tenverine) et PS5D: 
TTGGGGAGGTTGGCCGACGA (SEQ ID NO: 122) (situee a 6 nucleotides en aval 
du codon non-sens de l'enverine. Des modifications de la sequence de Tenverine ont 

25 ete observes sur TADN de certains des patients (figure 17). 

EXEMPLE 3 : Detection d'une proline selon I'invention dans un echantillon 
biologique. 

- Preparation d'une fraction proteique purifiee de liquide c^phalo- 
rachidien de patients atteints de SEP 
30 Apres un traitement & 56°C pendant 30 min, et elimination des 

immunoglobulines sur une colonne de proteine G HiTrap (Pharmacia), Tequivalent de 
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10 ml de LCR est depose sur une colonne de DEAE Sepharose CL-6B (Pharmacia). 
L'elution est realisee en Tris-HCl 20 mM pH 8,8, et un gradient de 0 a 0,4 M de NaCl, 
puis la fraction est dialysee 2 fois contre du tampon phosphate-NaCI (PBS). Apres 
concentration sur Ultrafree-MC (Millipore), la fraction est deposee sur une colonne de 
5 Superose 12 (FPLC Pharmacia) et eluee en presence de PBS. Apres separation par 
electrophorese en gel de polyacrylamide-SDS, et electo-transfert sur une membrane 
d'Immobilon-P (Millipore), les bandes proteiques sont soumises a une hydrolyse 
trypsique menagee. 

- Analyse de la fraction proteique par spectrometrie de masse 
10 Les peptides digeres en presence de trypsine, sont analyses par la 

methode de MALDI-TOF, qui permet l'analyse de peptides presents en melange. 
(COTTRELL J.S., Pept. Res., 1997, 7, 1 15-124). Les peptides caracterises en fonction 
de leur masse sont compares aux proteines et aux proteines associees selon 
T invention. 

15 EXEMPLE 4 : Detection d'anticorps specifiques anti-domaine env de HERV-7q. 

L' identification d'un long cadre de lecture ouvert au sein de la 
sequence env de HERV-7q, a permis de determiner une sequence proteique deduite 
SEQ ID NO:22 et 35 et figures 18-20 d'une region dudit gene. 

Les sequences de proteines deduites des sequences ID NO:22, 35 et 
20 des figures 18-20 sont positionnees comme suit par rapport a la figure 1 ou a la 
sequence ID NO:3 : 

SEQ ID NO:22 (cadre de lecture 1) et figure 19 : debut de la 
sequence codante : position 7874, fin de la sequence codante 1" codon non-sens 
(position 9493) 

25 SEQ ID NO:35 : debut de la sequence codante : position 7874, fin de 

la sequence codante 1 CT codon non-sens (position 9493) (cadre de lecture 1) 

Figure 19 : debut de la sequence codante : position 6970, fin de la 
sequence codante 1* codon non-sens (position 9493) (cadre de lecture 1) 

Figure 20 : debut de la sequence codante : position 6971, la fin du 
30 cadre de lecture est d6calee selon le cas de 1, 2 ou 3 codons 

Figure 21 : debut de la sequence codante : position 6972, la fin du 
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cadre de lecture est decalee selon le cas de 1 , 2 ou 3 codons 

Differents peptides correspondant a tout ou partie des SEQ ID 
NO:22 (voir SEQ ID NO:23-27 et 35) ont ete synthetises par genie genetique afin de 
tester leur specificite antigenique vis-a-vis de sera ou de tissus de patients atteints de 
5 SEP, par exemple. Brievement, tout ou partie de la region env de HERV-7q est sous 
clonee dans les vecteurs pQE30, 31 et 32. Les vecteurs pQE30 T 31 et 32 contiennent 
en 5' du multi-site de clonage les sequences consensuelles pour la transcription (le 
promoteur fort du bacteriophage T5, 2 operateurs de 1'operon lactose), la traduction 
(un site d'accrochage ribosomal synthetique). De meme, pQE30, 31 et 32 possedent en 

10 3', le terminateur de transcription du phage 1 ainsi qu'un codon "Stop" pour la traduc- 
tion. L'expression de la proteine s'effectue apres transformation dans E. coli Ml 5. Le 
plasmide pQE30, 31 et 32 possedent en amont du site de polyclonage la sequence 
codante pour une suite de 6 histidines presentant une afFinite pour les ions nickel. Cet 
enchainement permet la purification de la proteine chimerique exprimee. par adsorp- 

15 tion sur une resine constitute d'un ligand chelatant, l'acide nitrilotriacetique (NT A), 
charge de 4 ions nickel (resine NI-NTA, Qiagen). 

La transformation s'effectue par electroporation ou traitement au 
chlorure de calcium. Par exemple, une colonie d*E coli Ml 5 est incubee dans 100 ml 
de milieu LB contenant 250 \ig de kanamycine, sous agitation a 37°C jusqu'a 

20 Tobtention d'une DO 600 de 0,5. Apres une centrifugation de 5 minutes a 2000g a 4°C, 
le culot bacterien est repris dans 30 ml de solution TFB1 (100 mM de chlorure de 
rubinium, 50 mM de chlorure de manganese, 30 mM d'acetate de potassium, 10 mM 
CaCI2, 15% glycerol, pH 5.8), k 4°C pendant 90 minutes. Apres une centrifugation de 
5 minutes a 2000g a 4°C, le culot bacterien est repris dans 4 ml de solution TFB2 (10 

25 mM de chlorure de rubidium, 10 mM de MOPS, 75 mM CaC12 ? 15% de glycerol , pH 
8). Les cellules peuvent etre gardees a -70°C par aliquot de 500 ml. 20 jxl de la ligation 
et 125 jil de cellules competentes sont melanges et places dans la glace 20 minutes. 
Apres un choc thermique de 42°C pendant 90 secondes, les cellules sont agitees 90 
minutes a 37°C dans 500 ml de milieu Psi-broth (milieu LB complemente par 4 mM 

30 de MgS0 4 , lOmM de chlorure de potassium). Les cellules transformees sont etalees 
sur des boites LB-agar complementees par 25 jig/ml de kanamycine, et 100u.g/ml 
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d'ampicilline, et les boites sont incubees une nuit a 37°C. 

Les clones potentiellement recombinants sont repiques de maniere 
ordonnee sur un filtre de nylon depose sur une boite LB-agar complementee par 25 
jig/ml de kanamycine et 100 ug/ml d'ampicilline. Apres une nuit a 37°C les clones 
5 recombinants sont reperes par hybridation de l'ADN plasmidique avec la sonde 
nucleotidique amplifiee par PCR avec le couple d'amorces selon SEQ ID NO:45 et 
SEQ IDNO:46. 

Une colonie independante, contenant I'insert, est inoculee a 20 ml de 
milieu LB complementee par 25 ug/ml de kanamycine et 100 ug/mi d'ampicilline. 

10 Apres une nuit a 37°C sous agitation, 500 ml de meme milieu sont incubes au 1/50° 
par cette preculture jusqu'a 1'obtention d'une DO 600 de 0,8, puis 1 a 2 mM final d'IPTG 
est ajoute. Apres 5 heures, les cellules sont centrifiigees 20 minutes a 4000 g. 

Une partie du culot cellulaire est repris dans 5 ml de tampon de 
sonication (50 mM de phosphate de sodium pH 7,8. 300 mM NaCl) puis place dans la 

15 glace. Apres une rapide sonication, les cellules sont centrifiigees 20 minutes a 
10000 g. Une partie du culot cellulaire est repris dans 10 ml d'une solution 30 mM 
Tris/HCl-20% sucrose pH8. Les cellules sont incubees 5 a 10 minutes sous agitation, 
apres adjonction de 1 mM EDTA. Apres une centrifugation de 10 minutes a 8000 g a 
4°C, le culot est repris dans 10 ml de 5 mM de MgS04 glace. Apres 10 minutes dans 

20 la glace sous agitation, les cellules sont centrifiigees 10 minutes a 8000 g a 4°C. 

Le culot est repris par 5 ml/g dans du tampon A (6 M GuHCl 
(chlorhydrate de guanidine), 0,1M phosphate de sodium, 0,0 1M Tris/HCl, pH 8), 1 
heure a temperature ambiante. Le lysat est centrifuge 15 minutes a 10000 g a 4°C, et le 
sumageant est complements par 8 ml de resine Ni-NTA, preequilibree dans du tampon 

25 A. Apres 45 minutes k temperature ambiante, la resine est coulee dans une colonne, 
lavee par 10 fois le volume de la colonne par du tampon A puis par 5 fois le volume 
da la colonne par du tampon B (8 M uree, 0,1 M phosphate de sodium, 0,01 M 
Tris/HCl, pH 8). La colonne est lave par du tampon C (8 M uree, 0,lM phosphate de 
sodium, 0,01 M Tris/HCl, pH 6,3) jusqu'a ce que TA280 soit inferieur a 0,01. La 

30 proteine recombinante est eluee par 10 a 20 ml de tampon D (8 M uree, 0,1 M 
phosphate de sodium, 0,01 M Tris/HCl, pH 5 f 9) puis par 10 a 20 ml de tampon E (8 M 
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uree, 0,1 M phosphate de sodium, 0,01 M Tris/HCl, pH 4,5), puis par 20 ml de tampon 
F (6 M HC1, 0,2 M acide acetique). Apres une analyse en SDS-PAGE. la ou les 
fractions purifiees contenant la proteine chimerique ont permis Tobtention d anticorps 
chez le lapin. Les anticorps obtenus sont testes par Western-blot apres revelation par 
5 un anticorps secondaire couple a la phosphatase alcaline. 

Des anticorps sont obtenus de la meme maniere, a partir de peptides 
synthetises chimiquement selon la technique de Merrifield (G. Barany and B. 
Merrifield, 1980, dans The peptides, 2, 1-284, E. Gross et I Meienhofer. Academic 
Press, New York). 

10 Les anticorps specifiques obtenus sont utilises a fin de detection de 

I'expression serique ou tissulaire de tout ou partie des sequences retrovirales endo- 
genes selon Tinvention, dans les cas normaux et pathologiques. 

Les proteines d'origine serique ou tissulaire, sont separees sur gel 
d'acrylamide-SDS puis transferees sur un filtre de nitrocellulose a l'aide d'un appareil 

15 Novablot 2117-2250 (LKB). Le transfert est effectue sur une feuille de Hybond C- 
extra (Amersham) en utilisant un tampon CAPS 100 mM pH 11, methanol, eau 
(V/V/V: 1/1/8) contenant 1 mM de CaCl2- Apres un transfert de 1 heure a 0,8 

mA/cm 2 , la feuille est saturee une heure a temperature ambiante dans du PBS-0,5 % 
gelatine. La feuille est mise en presence de l'anticorps specifique a la concentration de 

20 1/1000 dans du PBS-0,25 % gelatine. Au bout de 2 heures, le filtre est lave 3 fois 15 
minutes dans du PBS-0,1 % de Tween-20, puis le filtre est incube 30 minutes en 
presence d'un anticorps secondaire couple a la phosphatase alcaline (Promega). dilue 
au 1/7500 dans du PBS-0,25% gelatine. Apres trois lavages dans du PBS-0,1 % de 
Tween-20, le filtre est equilibre dans un tampon (100 mM de Tris-HCl pH 9,5, 100 

25 mM de NaCl, 5 mM de MgCl2). La revelation est effectuee en presence de 45 |il de 
NBT a 75 mg/ml et 35 jllI de BCIP a 50 mg/ml, pour 10 ml de tampon de phosphatase 
alcaline. 

. Les proteines chimeriques obtenues par genie genetique, sont utili- 
sees aussi a fin de tests d'activite biologique, comme par exemple pour le test 
30 d'activite biologique du peptide de type CKS-17 identifie dans le domaine env de 
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HERV-7q (figure 5). 

EXEMPLE 5 : Obtention de sondes ribonucleiques codant pour les sequences env 
de HERV-7q. 

Les fragments de PCR obtenus sont sous clones dans le plasmide 
5 PGEM 4Z (Promega) qui possede de par et d'autre de son site de polyclonage, les 
sequences promotrices pour les ARN polymerase SP6 et T7. 

La methode de competence utilisee est 1'electroporation. Le plasmide 
et le fragment de PCR sont hybrides dans un rapport de 50 ng de vecteur (coupe a Sma 
I) pour 100 ng de fragment de PCR (rendu a bout franc par traitement par le fragment 

10 de Klenow de TADN polymerase). L'incubation a lieu une nuit a 22°C, dans le 
tampon de ligation (66 mM Tris-HCl pH 7,5, 5 mM MgCl2. 1 mM dithioerythritol, 
1 mM ATP) en presence de lu. de T4 ADN ligase puis est arretee par denaturation 10 
minutes a 65°C. Parallelement, la souche d'£. Coli JM 105 est ensernencee une nuit a 
37°C dans du milieu LB. Cette preculture est diluee au 1/500 et placee a 37°C jusqu'a 

15 une DO 600 egale a 1. Pour la suite du mode operatoire les cellules seront toujours 
conservees au froid. Apr&s une centrifugation de 5 minutes a 3500 g a 4°C, le culot 
cellulaire est resuspendu dans 1/4 vol. d'eau glacee ultra-pure. Cette etape est repetee 5 
a 6 fois. Puis le culot est resuspendu dans 1/4000 vol. d'eau; 10 % de glycerol sterile 
sont ajoutes permettant la conservation des cellules electrocompetentes, par aliquots 

20 de 10 [il a 20°C. A 50 |il de cellules electrocompetentes est ajoute 1 u.1 de la ligation ; 
le tout est soumis a une decharge electrique de 12,5 kV/cm, appliquee pendant 5,8 ms. 
Les cellules sont rapidement remises en suspension dans le milieu SOC. incubees 1 
heure a 37°C, puis etalees, en presence de 2% X-Gal dans du dimethylformamide, et 
10 mM d'IPTG, sur une boite de gelose LB-agar supplementee en ampicilline (100 

25 fig/ml). Apres une nuit a 37°C, les clones blancs potentiellement recombinants, sont 
repiques de maniere ordonnee sur une boite LB/ampicilline et parallelement sur un 
filtre de nylon depose sur une boite LB/ampicilline. Ces deux boites sont incubees une 
nuit a 37°C. Les clones recombinants sont alors reperes par hybridation avec une 
sonde nucleique amplifiee par PCR avec le couple d'amorces selon SEQ ID NO:45 et 

30 SEQ ID NO:46 et marquee a la digoxygenine. 

Les clones recombinants sont cultives dans 50 ml de milieu 
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LB/ampicilline (100 jig/ml) en agitation pendant une nuit a 37°C. Apres une centrifii- 
gation a 3500 g pendant 15 minutes a 4°C, le cuiot bacterien est repris dans 4ml de 
tampon PI (50 mM Tris-HCl, lOmM EDTA, 400 ng/ml RNase A, pH 8) et 4ml de 
tampon P2 (200 mM NaOH, 1% SDS). Le melange est incube a temperature ambiante 
5 pendant 5 minutes. Apres adjonction de 4ml de tampon P3 (2.55 M d'acetate de potas- 
sium, pH 4,8) le melange est centrifuge a 12000 g pendant 30 minutes a 4°C. Le 
surnageant est applique sux une colonne Qiagen-type 100, preequilibree avec 2 ml de 
tampon QBT (750 mM NaCl, 50 mM MOPS, 15% ethanol, pH 7). la colonne est lavee 
avec 2 fois 4ml de tampon QC (1M NaCl, 50 mM MOPS, 15 % ethanol, pH 7) et 

10 l'ADN est elue avec 2ml de tampon QF (1,2 M NaCl, 50mM MOPS, 1 5 % ethanol, pH 
8). L'ADN est precipite avec 0,8 vol. d'isopropanol, et centrifuge a 12000 g a 4°C 
pendant 30 minutes. Le culot est lave avec de 1'ethanol a 70 % glace, puis l'ADN 
plasmidique est repris par 2 fois 150 jal de tampon TE. 

Les sondes ribonucleiques sont utilisees comme sondes specifiques, 

15 en particulier pour la detection des transcrits exprimes par les sequences retrovirales 
endogenes selon l'invention. 

EXEMPLE 6 : Construction d'une souris transgenique contenant tout ou partie 
du gene de Penverine. 

Une souris transgenique contenant tout ou partie de la sequence 
20 HERV-7q (SEQ ID NO:3) est construite afin d'identifier les sequences responsables 
de la specificite tissulaire, et pour evaluer le role de tout ou partie des motifs retro- 
viraux endogenes de type HERV-7q, en particulier tout ou partie des motifs pepti- 
diques de l'enverine. La technique de micro-injection utilisee se refere a la technique 
classique (Hogan et coll., (1994), Manipulating the mouse embryo, Cold Spring 
25 Harbor, Cold Spring Harbor Laboratory Press) ou a ses equivalents. Des formes iden- 
tiques a la molecule humaine normale de motifs de type HERV-7q, dont Tenverine, ou 
des formes mutees, d^letees, presentant des insertions ou tronquees sont testees afin de 
determiner les motifs critiques tant sur le plan normal que pathologique, et plus parti- 
culierement au cours du developpement foetal et lors des processus tumoraux. 
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Ainsi que cela ressort de ce qui precede, Finvention ne se limite 

nullement a ceux de ses modes de mise en ccuvre, de realisation et d'application qui 

viennent d'etre decrits de fa9on plus explicite ; elle en embrasse au contraire toutes les 
15 variantes qui peuvent venir & Fesprit du technicien en la matiere, sans s'ecarter du 

cadre, ni de la portee, de la presente invention. 



WO 99/67395 



PCT/FR99/01513 



54 

REVINDICATIONS 

1°) Fragment d'acide nucleique purifie, caracterise en ce qu'il 
comprend tout ou partie d'une sequence codant pour une sequence retrovirale endo- 
gene humaine, qui presente au moins des motifs retroviraux de type env. repondant a 
5 la sequence SEQ ID NO:l ou a une sequence presentant un niveau d'homologie avec 
ladite sequence SEQ ID NO:l superieur ou egal a 80% sur plus de 190 nucleotides ou 
superieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env. 

2°) Fragment d'acide nucleique selon la revendication 1. caracterise 
en ce qu'il presente a la fois de motifs retroviraux correspondant a un domaine env et 

10 repondant a la sequence SEQ ID NO:l et des motifs retroviraux correspondant a un 
domaine gag et repondant a la sequence SEQ ID NO:2 ou a une sequence presentant 
un niveau d'homologie superieur ou egal a 80% sur plus de 190 nucleotides ou supe- 
rieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env et un 
niveau d'homologie superieur ou egal a 90% sur plus de 700 nucleotides ou superieur 

15 ou egal a 70% sur plus de 1200 nucleotides pour les domaines de type gag, lesquels 
motifs ne presentent aucune insertion ou deletion superieure a 200 nucleotides. 

3°) Fragment d'acide nucleique, caracterise en ce qu'il comprend un 
segment d'une sequence selon la revendication 1 ou la revendication 2 et notamment 
les sequence SEQ ID NO:3-22, 28 et 61, les sequences nucleiques complementaires et 

20 les sequences inverses complementaires des sequences precedentes ainsi que les 
fragments issus des regions codantes des sequences precedentes correspondant a un 
cadre glissant superieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

4°) Transcrits, caracterises en ce qu'ils sont generes a partir des 
sequences selon l'une quelconque des revendications 1 a 3. 

25 5°) Reactif de diagnostic pour la detection differentielle de 

sequences nucleiques endogenes humaines completes ou partielles. presentant des 
motifs retroviraux, selectionnes parmi les sequences SEQ ID NO:l et/ou SEQ ID 
NO:2, caracterise en ce qu'il est selectionne dans le groupe constitue par les sequences 
SEQ ID NO:l-22, 28, 37-57, 59-61 et 121-122, les sequences nucleiques comple- 

30 mentaires et les sequences inverses complementaires des sequences precedentes, par 
les fragments nucleotidiques capables de defmir ou d'identifier les sequences SEQ ID 
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N0:1 et/ou SEQ ID NO:2 et toute sequence flanquante ou les chevauchant ainsi que 
par les fragments issus des regions codantes des sequences SEQ ID NO: 1-22 et 6L 
correspondant a un cadre glissant superieur ou egal a 14 nucleotides ou leurs 
sequences complementaires, eventuellement marquees avec un marqueur approprie. 
5 6°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans les regions situees entre les nucleotides 3065 et 4390 ? les nucleotides 6965 et 
9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3. 

7°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences SEQ ID NO:37-57, 59-60 et 121-122 et en ce qu'il est apte 
1 0 a etre utilise comme amorce. 

8°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences suivantes : 

- un fragment de 1505 nt amplifie par le couple d'amorces SEQ ID 
NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

15 - un fragment de 2529 nt amplifie par le couple d'amorces SEQ ID 

NO:45 et SEQ IDNO:46 (amorces E1F et E1R) 

- un fragment de 182 nucleotides repete deux fois, sitae en amont du 
domaine gag aux positions 2502-261 1/2613-2865 

et en ce qu'il est apte a etre utilise comme sonde. 

20 9°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans le groupe constitue par les fragments codants ou non-codants pour tout ou partie 
de Tenverine et notamment les fragments comprenant au moins 14 nucleotides et plus 
particulierement les fragments codant pour la partie C-teiminale de l'enverine, soit a 
partir de I'acide amine 291, soit a partir de Tacide amine 32 L a compter du codon 

25 codant pour la premiere methionine. 

10°) Procede de detection rapide et differentiel des sequences 
nucleiques retrovirales endogenes de type env ou env et gag, de leurs variants 
normaux ou pathologiques, par hybridation et/ou amplification genique, realise a partir 
d'un echantillon biologique, lequel procede est caracterise en ce qu'il comprend : 

30 (a) une etape dans laquelle Ton met en contact un echantillon biolo- 

gique a analyser avec au moins une sonde selon la revendication 5, la revendication 6 
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ou la revendication 8 et 

(b) une etape dans laquelle on detecte par tout moyen approprie le ou 
les produits resultants de I'interaction sequence nucieotidique-sonde. 

1 1°) Procede de detection selon la revendication 10. caracterise en 
5 ce qu'il comprend : 

* prealablement a T etape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

conceme, 

. une etape d'extraction de Tacide nucleique a detecter, et 
10 . au moins un cycle d'amplification genique mis en oeuvre a 1'aide 

d'au moins un reactif selon Tune quelconque des revendications 5 a 7 et 

* posterieurement a T etape (b) : 

. une etape de comparaison des sequences nucieiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
15 Tune quelconque des revendications 1 a 3, par tout moyen approprie et notamment par 
sequen9age, Southern-blot, coupure de restriction, SSCP ou toute autre methode 
permettant d'identifier une insertion ou une deletion ou encore une simple mutation 
entre les differentes sequences comparees. 

12°) Procede de detection des transcrits selon la revendication 4, 
20 caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques temoins et d'echantillons analogues preleves chez des patients et 

- l'analyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a Taide d'un 

25 reactif de diagnostic selon Tune quelconque des revendications 5 a 9. 

13°) Sequences chimeres, caracterisees en ce qu'elles sont consti- 
tuees par un fragment de 17 a 40 nucleotides d'une sequence flanquante selectionnee 
dans le groupe constitue par les transcrits et ADNc des sequences genomiques, qui 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 

30 l'alteration est associee a l'expression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
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correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d ! une sequence retrovirale de ladite 
famille HERV-7q dont Tune des extremites ne peut se trouver a une distance excedant 
120 kb, associee a un motif retroviral endogene de type HERV-7q comprenant entre 
5 17 et 40 nucleotides selon les revendications 1 a 4. 

14°) Methode de detection et/ou devaluation d'une sur-expres- 
sion/sous-expression ou d'une modification d'au moins Tune des sequences ou frag- 
ments de sequences retrovirales endogenes de type HERV-7q et/ou de leurs sequences 
flanquantes associees, selon Tune quelconque des revendications 1 a 9, caracterisee en 
10 ce qu'elle comprend : 

- le depot sur un support approprie, de TADNc provenant de clones, 
de produits de PCR obtenus a partir d'ADN genomique. de produits de RT-PCR 
provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d*ADN etant des sequences ou des fragments de sequences retro- 

15 virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, constitutes par 
les transcrits et ADNc des sequences genomiques, qui codent pour tout ou partie d'un 
facteur, dont la fonction, la regulation/deregulation ou l'alteration est associee a 
Texpression normale ou pathologique ou a la regulation/deregulation de motifs 
appartenant a ladite famille HERV-7q, ces sequences correspondant a des sequences 

20 nucleotidiques codant pour des genes situes dans des regions flanquantes situees en 
amont et/ou en aval d'une sequence retrovirale de ladite famille HERV-7q dont Tune 
des extremites ne peut se trouver a une distance excedant 120 kb et/ou une sequence 
chimere selon la revendication 13, 

- Thybridation dudit support avec au moins une sonde marquee de 
25 maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 

provenant de cellules, de tissus ou de liquides biologiques provenant de temoins 
reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 
30 - la detection des hybrides formes. 

15°) Methode selon la revendication 14, caracterisee en ce que ledit 
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transcrit ou ADNc est selectionne dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. 

16°) Methode selon la revendication 14 ou la revendication 15. 
5 caracterisee en ce que ledit support comprend en outre toute sequence retrovirale 
endogene ou exogene. 

17°) Kit de detection et/ou devaluation d'une maladie auto-immune 
et notamment des neuropathologies a etiologie auto-immune, caracterise en ce qu'il 
comprend outre les tampons necessaires a la mise en ceuvre d ? un procede selon Tune 
10 quelconque des revendications 14 a 16 : 

- des reactifs A de diagnostic selon Tune quelconque des revendica- 
tions 5 a 9, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction. la regula- 

15 tion/deregulation ou 1'alteration est associee a Texpression normale ou pathologique 
ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q. ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 

20 excedant 120 kb, 

lesquels reactifs sont de preference fixes sur un support approprie. 
18°) Kit selon la revendication 17, caracterise en ce que lesdits 
reactifs B sont selectionnes dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
25 egal a 14 nucleotides ou leurs sequences complementaires. 

19°) Produits de traduction, caracterises en ce qu'ils sont codes par 
une sequence nucleotidique selon Tune quelconque des revendications 1 a 4. 

20°) Peptide, caracterise en ce qu'il est susceptible d'etre exprime a 
Taide d'une sequence nucleotidique selectionnee dans le groupe constitue par les 
30 sequences SEQ ID NO: 1-22, 28 et 61 selon l'une quelconque des revendications 1 a 4. 

21°) Peptide selon la revendication 20, caracterise en ce qu'il 
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englobe les peptides derives comprenant entre 5 et 540 aminoacides et notamment un 
fragment de 538 aminoacides, commencant a la premiere methionine de la sequence 
SEQ ID NO:26 (enverine). 

22°) Peptide selon la revendication 20 ou la revendication 21, 
5 caracterise en ce qu'il est selectionne dans le groupe constitue par : 

. les sequences SEQ ID NO:23-36 ; 

. la sequence SEQ ID NO:58 ; 

. un fragment C-terminal de la sequence SEQ ID NO:26, soit a partir 
de Tacide amine 291, soit a partir de l'acide amine 321, a compter de la premiere 
1 0 methionine de la sequence SEQ ID NO:26 ; 

- un peptide de type CKS-17/CKS-25 present dans Tune des 
sequences SEQ ID NO:23-36 ou 58 ; et 

- les peptides presentant une affinite avec un des haplotypes du 
systeme HLA de classe I ou de classe II et notamment les fragments 399-471, 244-271 

15 de l'enverine, ainsi que les peptides de sequence SEQ ID NO:68-l 18, conformement 
au Tableau I. 

23°) Peptide selon l'une quelconque des revendications 20 a 22, 
caracterise en ce qu'il est obtenu a partir des sequences nucleiques selon Tune 
quelconque des revendications 1 a 4, dans lesquelles au moins un codon non-sens peut 
20 etre remplace par un codon codant pour Tun des aminoacides suivants : Phe (F), Leu 
(L), Ser (S), Tyr (Y), Cys (C), Trp (W), Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly 
(G). 

24°) Compositions immunogenes ou vaccinales, pour la protection 
contre les maladies auto-immunes, notamment chez les sujets a risque, caracterisee en 
25 ce qu'elle comprend au moins un peptide comprenant au moins un motif de type CKS 
et/ou au moins un motif selectionne dans le groupe constitue par les peptides presen- 
tant une affinite avec un des haplotypes du systeme HLA de classe I ou de classe II et 
au moins un vehicule pharmaceutiquement acceptable. 

25°) Composition selon la revendication 24, caracterisee en ce que 
30 ledit peptide presentant une affinite avec un des haplotypes du systeme HLA de classe 
I ou de classe II, est selectionnee dans le groupe constitue par les peptides tels que 
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definis dans le Tableau I. 

26°) Composition selon la revendication 24 ou la revendication 25, 
caracterisee en ce que ledit peptide presente la sequence SEQ ID NO: 120. 

27°) Anticorps, caracterise en ce qu'il est dirige contre Tun ou 
5 plusieurs des peptides selon Tune quelconque des revendications 20 a 23. 

28°) Composition pharmaceutique, caracterisee en ce qu'elle 
comprend des anticorps neutralisants produits a partir des peptides du Tableau I (SEQ 
ID NO:68-l 18) et leurs homologues. 

29°) Procede de depistage immunologique differentiel de sequences 
10 retrovirales endogenes humaines de la famille HERV-7q normales ou pathologiques, 
caracterise en ce qu'il comprend la mise en contact d'un echantillon biologique avec 
un anticorps selon la revendication 27, la lecture du resultat etant revelee par un 
moyen approprie, notamment EIA, ELISA, RIA, fluorescence. 

30°) Procede d'identification et de detection de motifs retro viraux 
15 endogenes, anormalement exprimes dans le cadre de pathologies associees au cancer, 
ou de neuropathologies en particulier autoimmunes, au premier rang desquelles la 
sclerose en plaques, caracterise en ce qu'il comprend 1'analyse comparee des sequences 
extraites d'un echantillon biologique avec les sequences selon Tune quelconque des 
revendications 19 a 23. 

20 31°) Application des sequences selon Tune quelconque des revendi- 

cations 1 a 9, 13, 14 ou 19 a 23 au diagnostic, au pronostic, a revaluation de la 
susceptibilite genetique, a toutes maladies humaines induites, innees ou acquises en 
particulier celles a composantes cancereuses, autoimmunes et/ou a incidence neuro- 
logique, comme la sclerose en plaques, les syndromes associes et les maladies neuro- 

25 degeneratives ou intervient tout ou partie des sequences selon Tune quelconque des 
revendications 1 k 5 et des formes endogenes ou exogenes apparentees. 

32°) Sequences nucleiques hybrides, caracterisees en ce qu'elles 
comprennent des sequences ou motifs selon Tune quelconque des revendications 1 a 
9, combines avec des sequences ou motifs d'origine endogene ou d'origine ou induits 

30 de maniere exogene. 

33°) Vecteur recombinant de clonage ou d'expression, caracterise en 
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ce qu'il coraprend une sequence nucleique selon Tune quelconque des revendications 
1 4 4. 

34°) Composition immunogene ou vaccinale, caracterisee en ce 
qu'elle coraprend un vecteur incluant au moins une sequence nucleique codant un 
peptide tel que defini dans le Tableau I, eventuellement associee a une sequence 
codant un motif de type CKS-17. 

35°) Vecteur de therapie genique, caracterise en ce qu'il comprend 
tout ou partie des sequences nucleiques retrovirales endogenes de type HERV-7q 
selon Tune quelconque des revendications 1 a 4. 

36°) Vecteur selon la revendication 35, caracterise en ce que lesdites 
sequences sont selectionnees dans le groupe constitu^ par les sequences SEQ ID 
NO:2, 20et21. 

37°) Animaux transgeniques, caracterises en ce qu'ils comprennent 
tout ou partie d'une sequence de type HERV-7q (SEQ ID NO: 1 -22 , 28 et 61). 
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CCCTGGGGCGGGCTTCCTTTCTGGGATGAGGGCAAAACGCCTGGAGATACAGCAATTATCTTGCAACTGAG 

AGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTA GCTGGGAAGGTGACCACGTCCAC 

C TTTAAACACGGGGCTTGCAACT7AGCTCACACCTGACCAATCAGAGAGCTC ACTAAAATGCTAATTAGGCA 

AAGACAGGAG GTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAG GAGGGACAACAA7CGGGATA 

TAAA CCCAGGCATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTG TATGGGAGCTGTT?TC 

ATGC TATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTT CTTACGGCTCGAGCTGAGCT 

TTT nCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA CTCCCATCCCTCTGGATCCT 

f;rAG(^TGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCCCAA?TGGGCTAAAGGCTTG€CA 

T TfrrTCCTGCACGGCTAAGTGCCTGGGTrrGTTCTAATTGAGCTGAACACTA GTCACTGGGTTCCATGGTTC 

TCTTCT GTGACCCACGGCTTCTAATAGAACTATAACACTTACCACATGG CCCAAGATTCCArTCCTTGGAAT 

CCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCC ACCATCTTGGAAGCGGCCTGCTACCATCT 

TGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGGACCCCCCGGTAACATTTTGGCAACCACGAA 

CGGACATCCAAAGTGGTGAGTAATATTGGACCACTTTCACTTGCTATTCTGTCCTATCCTTCCTTAGAA7TG 

GAGGAAAATACCGGGCACTTGTCGGCCAGTTAAAAACGATTAGTGTGGCCACCGGACT7AAGACTCAGGTGT 

GAGGCTATCTGGGGAAGGGCTTTCTAACAACCCCCAACCCTTCTGGGTTGGGGACTTGGTTTGCCTCAAGCC 

AGCTTCCACTTTCAGTTTTCTTGGGGAAGCCGAGGGCCGACTAGAGGCAGAAAGCTGTCGTCCTGAAC7CCC 

GGCAGTAGCCGGTTGAGATCATGGTGTAGCCAGAAGTCTCAACAGTCGCCCATGCATGCACCCCTA7CTTTC 

CTTCTGACCCATACC7CCTGGGTCCCAACCACAACTTTCTTCAAAGTGTAGCCCCAAAA7TC7CCT7ACC7C 

TGAATA7ACTTCC7C7GATCCCTGCCTCCTAGGTAC7ATTGG7TCAGACTTCCAT7TCC7CTAGCAAGTTGT 

A7 C7CC AAAGGGATC TAAGGAAGC7CTGC GCTGCGT C CTT AGGC ACC T AGGC7 AT AAC CCAGGG AGTC7TA7 

CCCTGGTGTCCCTCCCAATT7AGGCATACAGCTCTTGACATGGGCAG7TATGTAGGACCCAC7CCCCACCAC 

CCTTGCCAGGGCCCCAAGTTTGTAAATGGCTGAGGGAAAAGAGAGACAGAGGAGAGAGAGAGAAATGGAGGA 

GAAAGAGAGAGAGACAGAGAGGAGAGAGAGACAG7GAGAGAGACAGAAGAGAGAGAGAGACAAAGAGGAGAG 

AGAGAGAGTCAAAGAGAGAAAGAAAGAGAAAGAAATAGTAAAAAACAG7GTGCCC7A7TCCT7TAAAAGCCA 

GGGTAAATT7AAAACC7GTACT7GATAATTGAAGGTCTTC7CTG7GACCCTATAGCAC7CCAATCCACTT7G 

TGGTCAGTG7AAATAAGAGCATAGGCCGAAA«:ACTGAGGCCA7TGACAACCCGTAGCTTCCCTA7CAAAAA 

TCCTTAACCCAGTAACCCGCAGATGGACCAAATGCATTCAGTCGGTAGCGCAACTGCTT7GCTAAAAGTAGA 

AAAGTAACTTT7AGAGGAAACC7CA7TGTGAGCACACCTCACCTGTTCAGAATTA7TC7AATAAAAAAAGCA 

AAAAGGTAGCT7AC7AACTCAAAJ^7C7TAAAGTATGGGGCTAT7CTGTTAGAAAAAGG7AA7GTAACTCCA 

ACCACTGATAATTCCCTTAACCCAGCAGATT7CCTAACGGGATTTAAATCTTAATTACCATACAAAGGTCCG 

ACCAGACCTAGGCGGAACTCCC7TCAGGACAGGACGATAGATGG7TCCTCCCAGGTGA77GAGGAAAAAAAC 

CACAATGGGTATTCAGTAATTGATACGGGGACTCTTGTGGAAGCAGAGTTAGAAAAA77GCCTAATAAC7GG 

TC7CCTCAAACGTGTGAGCTGTTTGCACTCAGCCAAGCCTTAAAG7ACTTACAGAATCAAAAGACTA7CTCA 

ATCCTGATTCAAAAGGT7AGCTACACCCTCTCTGTAATGCATT7GCATAAGAAC7TGTTTATGGGAATGCA7 

CTTCJlTCCCCCnnrT^^TTT^T™^ 

a AT GTTGGGCATGCTGGTAAAGGACC ACTAGAATC CAGCAGC CCAGACCCC 7 TT C TTTGTGGTC AAG AAA 
r,Grr ^AAAAGGGG7GCAGGACTGCTACATCGGTAAGCATAACTAATCCGATA AACAGAGGTCCATGGGTGG 
TTA CGCACCCTGGAAAGGAA C 7CACCCCTGAGCACAAAGGCAATGTTGGGC ACGCTGGTAAAGGACCACTAG 
AA Tf!CtAGCAGCCTGGACCCCT77C7TTG7GGTCAAGAGAGGCAGGAAAACA GGTGCAGGACTGCAACATCAG 
TGAGCATA AC7AATTCGATAAGCAGAGGTCCATGGG7GGTGATGCACCCTGGAAAGAA TAAGCA7TAGGACC 
ATAGAGGACACTCCAGGAC7AAAGCTCATCGGAAAATGACTAGGG77GCTGGCATCCCTA7GTTCTTTTT7C 
AGATGGGAAACGTTCCCCGCAAGACAAAAACGCCCCTAAGACGTATTCTGGAGAAT7GGGACCAATTTGACC 

T ATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCAAATGGAGTGAAGTGC CATAAGTACAAACT 

TTCTTTTCAT TAAGAGACAACTCACAATTATGTAAAAAGTGTGATTTATGC CCTACAGGAAGCCTTCAGAG7 

CTAC CTCCCTATCCCAGCATC CCCGACTCCTTCCCCAACTAAT A AGGACCCCCCTTCAACCCAA^^ 

AAA ttAGA TAGA CAAAAGGGTAAACAGTGAACCAAAGAGTGCCAA TA TTCCCC AA TTA TGACCCCTCCAAGC 

AGTGGG AGGAAGAGAATTCGGC CCAGCCAGAGTGCA TG TGCCTTT T TCTCTCCCAGACTTAAAGCAAA TAAA 

AACAGACTTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAA GGGTTAGGACAATTCTT 

TGATCTGACATGGAGAGATATAATGTCACTGCTAAATCAGACACTAACCCC AAATGAGAGAAGTGCCACCAT 

AA CTGCAGCCTGAGAGTTTGGCGA TCTCTGGTA TCTCAGTCAGGTCAA TGA TAGGA TGACAACAGAGGAAAG 

A GA A TGATTCCCCACAGGCCAGCAGGCAGTTCCCAGTCTAGACCCTCA TTGGGACACA GAA TCAGAACA TGG 

AGATTG GTGCTGCAGACATTTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAA CTAGGAAGAAGTCTATGAA 

TTACT CAA TGA TG TCCACCA TAACACAGGGAAGGGAAGAAAA TCCTACTGCCT TTCTGGAGAGAC TAAGGGA 

GGCA TTGAGGAAGCGTGCCTCTCTGTCACCTGA CTCTTCTGAAG GCCAACTAA TCTTAAAGCG TAAG TTTA T 

C ACTCAGTCAGCTGCAGACA TTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCC CGGAGCAAAACTTA GAAAC 

CC TA TTGAACTTGGCAA CCTCGGT TTTTTA TAA TAGAGA TCAGGAGGAGCAGGCGGAA CAGGACAAACGGGA 

TTAAAAAAAAGG CCACCGCTTTAGTCA TGACCCTCAGGCAAGTGGACTTTGGA GGCTC TGGAAAAGGGAAAA 

GCTGG GCAAA TTGAA TGCCTAA TAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAA A GA T T GTC 

CAAG TAGAAGTAAGCCGCCCCCTCGTCCA TGCCCCTTA TTTCAAGGGAATCAC TGGAAGGCCCACTGCCCCA 

GGGGA CAAAGGTCC TCTGAGTCAGAAGCCACTAACCAGA TGA TC CAGCAGCAGGA CTGAGGG TGCCTGGGGC 

AAGCG CCA7CCCATGCCA7CACCCTCACAGAGCCCTGGGTATGC T7GACCATTGAGGGCCAGGAGGT7GTCT 

CCTGGAC ACTGGTGCGGTCTTC7TAGTCTTACTC77CTGTCCCGGACAACTGT CCTCCAGA7C7GTCACTAT 

CTG AGGG«STCCTAAGAC«5«:AGTCACTAGATACT^CTCCCAGCC ACTAAG7TATGACTC^GGAGCTTTAT 

TCTTTTCA CATGCTTTTCTAATTA7GCTTGAAAGCCCCAC7ACCTTGTTAGGGAGAGA CAT7CTAGCAAAAG 

PAGGG GCCATTATACACCTGAACA7AGGAGAAG<jAACACCCGTTTG T^GTCCCCTGCT7GAGGAAGGAA7T_A 

AT CCTGAAGTCTGGGCAACAGAAGGACAATATGGACGAGCAAAGAATGCCCGTCC TG77CAAGTTAAACTAA 

AGGATTCC ACCTCCTTTCCCTACCAAAGGCAGTACCCCCTCAGACCCAAG GCCCAACAAGGACTCCAAAAGA 

TTG TT AAGGACCTAAAAGCCC AAGGC CT AGT AAAACC ATGCAGTAACCCCTGC AG7 ACTC C AATTT T AGGAG 

T AC AGAAACC CAAC AGAC AGTGGAGGTT AGTGC AAGAT CTCAGG ATTATC AA7GAGGC7G7TGT TCCTCTA7 

AGCCAGCT GTACCTAGCCCT TATACTCTGCTTTCCCAAATACCAGAGGAAGC A GAGTGG77TACAG7CCTGG 

ACCTTCAGGATGCCTTCTTC7GCATCCCTGTACATCCTGACTCTCAAT7CTTGTT TGCCTT7GAAGA7AC7T 



region 
reoetee 



143 

215 

2S7 

359 

-131 

503 

575 

547 

719 

791 

563 

935 
iO(P 
1079 
1151 
1223 
1295 
1367 
1439 
1511 
1583 
1655 
1727 
1799 
1871 
1943 
2015 
2087 
2159 
2231 
2303 
2375 
2447 
2519 
2591 
2663 
2735 
2807 
2879 
2951 
3023 
3095 
3157 
3239 
3311 

3333 

3455 

3527 

3599 

3671 domaine 

3743 gag 

3815 

3887 

3959 

4031 

4103 

4175 

4247 

4319 

■1391 

4463 

4535 

4 607 

4679 

4751 

4823 

4895 

4967 

5039 domaine 
5111 pol 
5183 



regions 
repetees 
en tandem 
R2 



FIGURE 1.1 



WO 99/67395 



PCT/FR99/01513 



2/64 

CAAACCC AACATCTC AACTC ACCTGGACTATTTT AC C CCAAGGGTTC AGGGAT AGTCC C C ATCT A7TTGGC C 
AGGCATTAGCCCAAGACTTGAGCCAATCCTCATACCTGGACACTTGTCCTTCGGTA GGTGGA7GATTTACTT 
TTGGCCGCCCATTCAGAAACCTTGTGCCATCAAGCCACCCAAGCGCTCTTCAA TTTCCTCGCTACCTGTGGC 
TACATGGTTTCCAAACCAAAGGCTCAACTCTGCTCACAGCAGGTTACTTAGGGCTAAAA7TAT CCAAAGGCA 
CCAGGGCCCTCAGTGAGGAACACATCCAGCCTATACTGGCTTATCCTCATCCCAAA ACCCTAAAGCAACTAA 
GGGGATTCCTTGGCGTAATAGGTTTCTGCCGAAAATGGATTCCCAGGTATGGCGAA ATAGCCAGGTCATTAA 
ATACACTAATTAAGGAAACTCAGAAAGCCAATACCCATTTAGTAAGATGGACAAC7GAA GTAGAAGTGGCTT 
T CCAGGCCCTAACCCAAGCCCCAGTGTTAAGTTTGCCAACAGGGCAAGACTTTTCTTCA TATGTCACAGAAA 
AAACAGGAATAGCTCTAGGAGTCCTTACACAGATCCGAGGGATGAGCTTGCAACCTGTG GCATACCTGACTA 
AGGAAATTGATGTAGTGGCAAAGGGTTGACCTCATTGTTTACGGGTAGTGGTGGCA GTAGCAGTCTTAGTA? 
CTGAAGCAGTTAAAATAATACAGGGAAGAGATCTTACTGTGTGGACATCTCATGAT GTGAATGGCATACTCA 
CTGCTAAAGGAGACTTGTGGCTGTCAGACAACTGTTTACTTAAATGTCAGGCTCTA TTACTTGAAGGGCCAG 
TGC TGCGACTGTGCACTTGTGCAACTCTTAACCCAGCCACATTTCTTCC AGACAATGAAGAAAAGATAAAAC 
ATAACTGTCAACAAGTAATTTCTCAAACCTATGCCACTCGAGGGGACCTTTTAGAGGTTCCTTTGACTGATC 
C CGACCTCAACTTGTATACTGATGGAAGTTCCTTTGTAGAAAAAGGACTTCGAAAA GTGGGGTATGCAGTGG 
TCAGTGATAATGGAATACTTGAAAGTAATCCCCTCACTCCAGGAACTAGTGCTCAGCTA GCAGAACTAATAG 
CCCTCACTTGGGCACTAGAATTAGGAGAAGAAAAAAGGGCAAA7ATA7ATACAGACTCTAAATATGCTTACC 
TAGTCCTCCATGCCCATGCAGCRATATGGAAAGAAAGGGAATTCCTAACTTCTGAG AG^CACCTATCAAAC 
A TCAGGAAGCCATTAGGAAATTATTATTGGCTGTACAGAAACCTAAAGA GGTGGCAGTCTTACAC7GCCGGG 
G TCATCAGAAAGGAAAGGAAAGGGAAAT AGAAGAGAAC TGCCAAGCAGATATT GAAGCC AAAAGAGCTGC AA 
GG CAGGACCCTCCATTAGAAATGCTTATAAAACAACCCCTAGTATAGGGTA ATCCCCTCCGGGAAACCAAGC 
CC CAGTACTCAGCAGGAGAAACAGAATGGGGAACCTCACGAGGACAGTTTT CTCCCCTCGGGACGGCTAGCC 
ACTGA AGAAGGGAAAATACTTTTGCCTGCAACTATCCAATGGAAATTACTT AAAACCCTTCATCAAACCTTT 
CACTTAGGCATCGATAGCACCCATCAGATGGCCAAATCATTATTTACTGGA CCAGGCCTTTTCAAAACTATC 
AAGCAGATAGTCAGGGCCTGTGAAGTGTGCCAGAGAAATAATCCCCTGCCTTATCGCCAAGCTCCTTCAGGA 
GAAC AAAGAACAGGCCA TTACCCTGGAGAAGACTGGCAACTGATTTTACCC ACAAGCCCAAACCTCAGGGA T 
TTCAG TA TCTACTAGTCTGGGTAGA TACTTTCACGGGTTGGGCAGAGGCCT TCCCCTGTAGGACAGAAAAGG 
ttCA AGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGA GGCTTACAGAGTG 
AC AATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGT TAGGTATACGATATCAC7TAC 
AC TGCGCCTGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAA TGAA TGAAACACTCAAA GGA CA TCTAAAAA 
AGCAAA CCCAGGAAACCCACCTCACA TGGCCTGCTCTGTTGCCTATAGCCT TAAAAAGAA TCTGCAACTTTC 
CCC AAAAAGCAGGACTTAGCCCA TACGAAA TGCTGTA TGGAAGGCCCTTCA TAA CCAATGACCTTGTGCTTG 
ACCCAA GACAGCCAACTTAGTTGCAGACATCACCTCCTTAGCCAAATATCA ACAAGTTCTTAAAACATTACA 
A GGAACCTA TCCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACA TGG TA TTAGTCAAGTCCCTTCC 
CTCTAA TTCCCCA TCCCTAGA TACA TCCTGGGAAGGACCCTACCCAGTCAT TTTA TCTACCCCAACTGCGGT 
TAAA GTGGCTGGAGTGGAGTCTTGGATACATCACACTTGAGTCAAATCCTG GATACTGCCAAAGGAACCTGA 
AAA TC CAGGAGACAACGCTAGCTA TTCCTG TGAACCTCTAGAGGA TTTGCGCC TGCTCTTCAAA CAACAA CC 

aggagga aagtaactaaaatcataaatccccatggccctcccttatcatatttttc tctttactgttctttt 

AC CCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACCAGTAGCT CCCCTTACCAAGAGTTTCT 

A TGG AGAATGCAGCGTCCCGGAAA ta ttga tgcccca tcgta taggagtctttctaagg gaacccccacctt 

CACTG CCCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCA TGCATGCAAATACTCATTA 

TTG GACAGGAAAAA tga t taa tcctagttgtcctggaggacttggagtcactg tc tgttggact tacttcac 

CCAAA CTGGTA TGTCTGA TGGGGGTGGAGTTCAAGATCAGGCAAGAGAAAAAC A TGTAA AAGAAGTAA TCTC 
CCAA CTCACCCGGGTACATGGCACCTCTAGCCCCTACAAAGGACTAGA TCTCTCAAAAC TACA TGAAACCCT 
C CGTACCCATA CTCGCCTGGTAAGCCTATT TAATACCACCCTCACTGGGCT CCATGAGGTCTCGGCCCAAAA 
CCCTACT AACTGTTGGA TATGCCTCCCCCTGAACTTCAGGCCA TATGTTTC AATCCCTGTACCTGAACAA TG 
GAA CAACTTCAGCACAGAAA TAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTT CCAA TCTGGAAA TAAC 
CCA TACCTCAAACCTCACCTGTGTAAAA TTTAGCAA TACT AC A TACACAAC CAACTCCCAA TGCA TCAGGTG 
GGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCT GTGGTACCTCAGCCTATCG 
TTGTTTGAA TGG CTCTTCAGAA TCTA TGTGCTT^CTCTCA TTCTJAGTGCCCCCTA TGA CCA TCTA CACTGA 
ACAAGATTTA T ACAGTTATGTCA TA TCTAAGCCCCGCAACAAAAGAGTACCCA ^^^^J^J^J^ 

ATCTCAAGAACTAAATGGG G pCATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 
[?r^G^G(^GTAGTCCrTCA^AA T CGAAGAGCTTTAGA^TT^TAACCGCTGAAAGAGGGGGAACQTGJtZX 
Vtt*^T J ^ ?praTAAGAA TGCTfQfT ft 'I ^ATGTTAA T C& A TCCGGAA TCGT CACTGAGAAAGTTAAAGAAA TTCG 
AGA TCGAJ^M^AACGTA GAGCA GGA GCTTCGA AACACTGGACCCTGGGGCCTCCTCAGCCAA TGGA TGCC 

ct^aTTCt'ccctt^ 

CCTCCTTG TTAA CTTTGTCTCTTCCAGA J^ TCGAA GCTGTAAAACTACAAA TGGAGCCCAAGA TGCAGTCCAA 

hl&AiLTC^ 

CCCTCCTGAGGAM^ 

T rfifi T A H f^fff nniLrTLfzr& ptt a/tnTTTTPrTflTTG AGATGGGGGACTGAGAGACAGGACT AGCTGG AT 
TTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACCACATC CACCTTTAAACACGGGGCTTG 
CAA CTrAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTAGGC AAAGACAGGAGGTAAAGAA 
ATA GCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACAATGATCGGGAT ATAAACCCAAGTCTTCGAG 
CCG GCAACGGCAACCCCCTTTGGGTCCCCTCCCTTTGTATGGGAGCTCTGTTTTC ATGCTATTTCACTCTAT 
TAAATC TTGCAACTGCACTCTTCrGGTCCATGTTTCTTACGGCTTGAGCT G^CTTTCGCTCGCCATCCACC 
ACTGCTG TTTGCCGCCACCGCAGACCCGCCGCTGACTCCCATCC CTCTGGATCATGCAGGGTGTCCG^TCTG 
rTrrTfiATCnAGC GAGGCACCCATTGCCGCTCCCAATCGGGCTAAAGGCTTGC CATTGTTCCTGCATGGCTA 
AGTGCCTG GGTTCATCCTAATTGAGCTGAACACTAGTCACTGGGTTCCATGGTTC TCTTCTGTGACCCACAG 
CTT CTAATAGAGCTATAACACTCACCGCJVTGGCCCAAGGTTCCA TTCCTTGAATCCATAAGGCCAAGAACCC 
CAGGTCAGAGAACACGAGGCTTGCCACCATCTTGGGAGC TCTGTGAGCAAGGACCCCCAAGTAACACAACCA 
TGAGGGTGCAAATGCATGGGCCACTAATGGTAGAGCAAGAAAACAGAAGGGCCCTGGTTCCTCGAAGGCATC 
AGTGAGCTGAAATGCCTGCCCTGGATGTCCTATTCCTAGGTGTTTTTCTGCCTGAAGCAGATTAAACCCTTT 
GTTCACTTCTCCAAGTAGGGCTTCTATTACAGCCCAAATCAATCCCCACCCCAGATGACAT 
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ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 



ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 
ACGTCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 

ACATCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 
TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 

TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 
ACAATCGGGATATAAACCCAGGCATTCGAGCTGGCAACAGCAGCCCCCC7TTGGGTCCC7TCCCTTTGTA 

ATGATCGGGATATAAACCCAAGTCTTCGAGCCGGCAACGGCAACCCCC-TTTGGGTCCCCTCCCTTTGTA 
TGGGAGCT— GTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 

TGGGAGCTCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 
TACGGC7CGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA 

TACGGCTTGAGCTGAGCTTTCGCTCGCCATCCACCACTGCTGTTTGCCGCCACCGCAGACCCGCCGCTGA 
CTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCC 

CTCCCATCCCTCTGGATCATGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCACCCATTGCCGCTCC 
CAATTGGGCTAAAGGCTTGCCATTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAAC 

CAATCGGGCTAAAGGCTTGCCATTGTTCCTGCATGGCTAAGTGCCTGGGTTCATCCTAATTGAGCTGAAC 
ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACA 

ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACAGCTTCTAATAGAGCTATAACACTCACCGCA 
TGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCA 

TGGCCCAAGGTTCCATTCCTTG-AATCCATAAGGCCAAGAACCCCAGGTCAGAGAACACGAGGCTTGCCA 
CCATCTTGGAAGC 



CCATCTTGGGAGC 
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IPMALPYHIFLFTVLLPSFTLTAPPPCRCMTSSSPYQEFLWRMQRPGNIDAPSYRSLSKG 
TPTFTAHTHMPRNCYHSATLCMHANTHYWTGKMINPSCPGGLGVTVCWTYF7QTGMSDGG 
GVQDQAREKHVKEVISQLTRVHGTSSPYKGLDLSKLHETLRTHTRLVSLFNTTLTGLHEV 
SAQNPTNCWICLPLNFRPYVSIPVPEQWNNFSTEINTTSVLVGPLVSNLEITHTSNLTCV 
KFSNTTYTTNSQCIRWVTPPTQIVCLPSGIFFVCGTSAYRCLNGSSESMCFLSFLVPPMT 
IYTEQDLYSYVI5KPRNKRVPILPFVIGAGVLGALGTGIGGITTSTQFYYKLSQELNGDM 

ERV ADSLVTLQDQLNSIAAVVI^NRRftlJDIXTAERGGTCLFLGEECCT IRDRI QRRAEELR 

NTGPWGLLSQV^ffiWILPE^ 

RSDVNDIKGTPFEEISAAQPLLRPNSAGSS 



TSFVEKANGVXCHKYKLSFHXETTHNYVKSVIYALQEAFRVYLPILPASPTPSPTNKDP 

J^IPQLXPI^AVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPDGYIDVLQGLGQFFDLTWRDIMSLLNQTLTPNER 

SATITAAXEFGDLWYLSQVNDRMTTEEREXFPTGQQAVPSLDPHWDTESEHGD^ 

MSTITQGREENPTAFLERLREALRKRASLSPDSSEGQLILKRKFITQSAADI^ 

NRDQEEQAEQDKRDXKKGHRFSHDPQASGLWRLWKREKLGKLNAXXGLLPVRSTRTIJCK^ 

LEGPLPOGTKVLXVRSHXPD/ SSSRT 
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NSLAAWLQNRRALDLLTAESGGTFLFLEEKC 
NSLAAWLQNRRALDLLTAERGGTCLFLGEEC 
DSLAAVTLQNHQGLDLLTAEKGGLCYFLGEDC 
DSLAAVTLQNHQGLDLLIAEKGGLCTFLGEEC 
DSLAAVTLQNCRGLDLLTAEKGGHYTFLGEEC 



LQNRRGLDLLFLKEGGLC 
DSLAKWLQNRRGLDLLTAEQGGICLALQEKC 
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CCTGGCACTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCA 



CCTGGC-CTCCTGAGGGAAGTATAAArTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGAAG 
-CAAATGGAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAACTCACAATTATGTAAAAA 

GCAAATGGAGTGAAGTGCCATATGTACAAACTTTCTTTTCATTA^ 

GTGTGATTTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCAT — CCCCGACTCCTTCC 

GTCTGAT^ATGCCCTACAGGAAGCCCTCAGAGTCTACCTCCCGACCCCAGCAAGACCCCAACTCCTTCT 
CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGGGTAAACAGTGAAC 

CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGGGTAAACAATGAAC 
CAAAGAGTGCCAATATTCCCCAATTATGACCC-CrCCAAGCAGTGGGAGGAAGAGAATTCGGCCCAGCCA 

CAAAGAGTGCCAATATTACACGATTAT-ACTCGCTCCAAGCAGTGGGAGGA-GA-ATTT-GGCCCAGCCA 
GAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGTAAATTCTCAGATAA 

GCGTGCATGTACCTTTTTCTCTCTCAGATTTAAAGCAAATTAAAATAGACCTAGGTAAATTCTCAGATAA 
CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACATGGAGAGATATAATG 



CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATCCTTTGATCTGACATGGAGAGATATAATG 
TCACTGCTAAATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCG 

TTACTGCTAAATCAGACACTAACCCCAAATGAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCG 
ATCTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCA 

AACTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCA 
GCAGGCAGTTCCCAGTCTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACAT 

GCAGGCAGTTCCCAGTGTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACAT 
TTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCA 

TTGCTAACTTGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCC 
CCATAACACAGGGAAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAGGAAGCG 

CTATAACACAGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAGGAAGCA 
TGCCTCTCTGTCACCTGACTCTTCTGAAGGCCAACTAATCTTAAAGCGTAAGTTTATCACTCAGTCAGCT 

TACCTCCCTGTCACCTGACTCTATTAAAGGCCAACTAATCTTAAAGGATAAGTTTATCACTCAGTCAGCT 
GCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCAAAACTTAGAAACCCTATTGAACT 

GCAGAGATTAAGAAAAAACTTCAAAAGTATGCCTTAGGCCCAGAGCAAAACTTAGAAACCCTACTGAACT 
TGGCAACCTCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACAGGACAAACGGGATTAAAAAAA 

TGGCAACCTCAGTTTTTTATAATAGAGATCAGGAAGAGCAGG-GGAATGGGACAAATGGGATAAAAAAAA 
A GGCCACCGCTTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAA 

AAAAAAAAGGTGACTGCTTTAGTCGTGGCCCTCAGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAA 
GCTGGGCAAATTGAATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTG 



GCTGAGCAAATTGAATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTG 
TCCAAGTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACTGC 

TCCAAGTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACTGC 
CCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCC 

CCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAATCCAGCAGCAGGACTGAGGATGCC 
TGGGGCAAGCGCCATCCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGA 

CAGGGCAAGCGCCAGCCCATGCCATCACCCTCACAGAGCCTTGGGTATGCTTGACCATTGAGGGCCAGGA 
GGTT -GTCTCCTGGACACTGGTGCGGTCTTCTTAGTCTTACTCTTCTGTCCCGGACAACTGTCCTCC 

GGTTCACTGTCTCTTGGACACTGGTATGGCCTTCTCAGTCTTACTCTCCTGTCCTGGACAACTGTCCTTC. 
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01/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

02/ TAAATCCCC-TGGCCCTCCCTTATCATATTTTTCT 

03/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

04/ TAGATCCTCATGGCCCTCC-TTGTCATATTTTTTT 



01/CTTTACTGTTCTTTTA-CCCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACC 
02/CTTTACTGTTCTCTTACCCCCCTTTCACTCTCACTGCACCCCGTCCATGCCACTGCACCCCC 
03/CTTTACTGTTCTCTTA-CCCCCTTTCTCTCTCACTGCACCCCCTCCATGCTGCTGTACAACC 
04/CTTTACTGTTCTCTTA-CCCCCTTTCACTCTCACTGAACCCCCTCCATGCCACTGTACTACC 

01/AGT AGCTCCCCTTACCAAGAGTTTC7ATGGAGAATGCAGCGT 

02/GTCCATGCCCGTCTCATGCCAGTAGCTCCCCTTAGCAAGAGTTTCTATGGAGAATGCAGCGT 

03/AGC AGCTCCCCTTACCAAGAGTTTCTATGAAGAATGCGGCTT 

04/AGT AGCTCCCATTACCAAGAGCTTCTATGGACAATGCGGCTT 

01/CCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGC 
02/CCCGGAAATATTGATGCCCCATTGTATAGGAGTTTATCTAAGGGAACCCCCACCTTCACTGC 
03/CCCAGAAATATTGATGCCCCATCAAATAGGAGTTTACCTAAAGGAAACTCCACCTTCACTGC 
04/CCTGGAAATATTGATGACCCATCGTATAGGAGTTTTTCTAAAGGAAACCCCATTTTCACCAC 

01/CCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTC 
02/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
03/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
04 /CCACACCTATATGACCC 

01/ATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGT 

02/ATTATTGGACAGGAAAAACGATTAATCCCAGTTGTCCTGGAGGACTTGGAG 

03/ATTATTGGACAGGGAAAATGATTAATCCTAGTTGTCCTGGAAGACTTGGAGCCACTGTCTGT 
04/ 

01/TGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
02/— GACTCACTTCACTCATACCAGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAACAGA 
03/CGGACTTACTTCACCCATACTGGTATGTCTGAGGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
04/ 

0 1 / AAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACA 

02 / AAAACACATAAAGGAAGTAATCTCCCAACTGACCTGGGTACATAGCACCCCTGGCCCCTACA 
03/AAAACATGTAAAGGAAGTAACCTCCCAACTGACCCGGGTACATAGCACCCCTAGCCCCTACA 
04/ 

0 1 / AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTA 
02/AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCATACCCATACTGGCCTGGTAAGCCTA 
0 3 / AAGG ACTAGATCTCTTAAAACTACATGAAACCCTCCAT ACCC ATACTTGCCTGGT AAGCCTA 
04/ 

01/TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 
02/TTTAATACCACCCTGACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 

0 3/TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGTCCAAAACCCTACTAACTGTTGGTT 
04/ 

0 1 / ATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAACAATGGAACAACT 
02/GTGCCTCCCCCTGCACTTTAGGCCATACATTTCAATCCCTATACCTGAACAATGGAACAACT 
03/GTGCCTCCCCCTGTATTTCAGGCCATGCATTTCAATCCCTGTACCTGAACAATGGAACAACT 
04/ TGCACTTC AGGCC ATACATTTCAAT CCCTGTA 
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0 1 /TCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCC AATCTGGAAATA 

02/TCAGCACAGAAATAAACACCACTTCTGTTTTAGTAGGTCCTC TTTCCAATCTGGAAATA 

0 3 /AC AGC ACAGAAAT AAAC ACCACTTCCGTTTTAGT AGGACCTCTTGTTTCC AATCTGGAAATA 



0 1 /ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCA 
02/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTATAGACACAGCCAACTCCCA 
03/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTGTAGACACAACCAACTCCCA 
04/ 

0 1 /ATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
02/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 

0 3 / ATGCATCAGGTGGGTAACTCCTCCCACACGAAT AGTCTGCCTACCCTCAGGAA? ATTTTTTG 
04/ 

01/TCTGTGGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
02/TCTGTGGTACCTCAGCCTATCATTGTTTGAATGGCTCTTCAGAATCTGTGTGCTTCCTCTCA 
03/TCTGTGGTACCTTAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
04/ 

01/TTCTTAGTGCCCCCTATGACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAA 
02/TTCTTAGTGGCCCCTATGCCCATCTACACTGAACAAGATTTATACAATCATGTCATACCTAA 
03/TTCTTAGTGCCCCC-ATGACCATTTACACTGAACAAGATTTATACAATTATGTTGTACCTAA 
04/ 

01/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGGAGCAGGAGTGCTAGGTGCAC 
02/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATTGGAGCAGGAGTGCTAGGCGGAG 
03/GCCCCACAACAAAAGAGTACTCATTCTTCCTTTTGTTATCGGAGCAGGAGTGCTAGGTGGAC 
04/ 

0 1 /TAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
02/TAGCTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTGTCTCAAGAA 
03/TAGGTTCTGGCATTGGCGGTACCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
04/ 

0 1 /CTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 
02/CTTAAAGGTGACATGGAATGGGTCGCTGATACCCTGGTCACCTTGCAAGATCAACTTAACTC 

0 3/CTCAATGGTGACATGGAATGGGTTGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTT 
04/ 

0 1 /CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
02/CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCGGAAAGCGGGG 
03/CCTAGCATCAGTAGTCCTTCAAAATTGAAGAGCTTTAGACTTGCTAACCTCTGAAAGAGGGG 
04/ 

0 1 /GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTT 

02/GAACCTTTTTATTTTTAGAGGAAAAATGCTGTTGTTATGTT 

03/GAAGCTGTTTATTTTTAGGGGAAGAATGTTGTTATTATGTTATTTTAGCGGAAGAATGTTGT 
04/ 

0 1 / AATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATACA 

02/ AATCAATCCGGAATCATCACCGAGAAAGTTAAAGAAATTCAAGGTCGAATATA 

03/TATTATGTTAATCAATCCTGAATTGTCACAGAGAAAGTTGAAGAAATTCGAGATTGAATACA 
04/ 

0 1 / ACGTAGAGCAGAGGAGCTTCGAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
02/ACGTAGAGCAAAGGAGCTGCAAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
03/ACGTAGAACAGAGGAGCTTCAAAAACACCAGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
04/ 
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01/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTA 
02/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGTTACTCCTCTTTGGACCCTGTA 
03/GGATTCTCCCCTTCTTAGGATCTCTAGCAGCTCTAATATTGATACTCCTCTTTGGACCCTGTA 
04 / 

0 1 /TCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTA 

02/TCTTTAACCTCCTTGTTAAGTTTGTCTTTTCCAGAATCGAAGCAGT71AAACTACAAATCGTTC 
0 3 /TCTTTAACCTCCTTGTTAAGTTTGTCTCTTCCAGAATCAAAGTTGTAAAGCTACAAATCGTTC 
0 4 /TCTTTAACCTCCTTGTTAAGCTTGTCTCTTGCAGAATCGAAGCTGTAAAACTACAAATGCTTG 

01/ — CAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 
02/TTCAAATGGAGCCCCAGATGCAGTCCATGAGTAAAATCTACCACGGACCCCTGGACCGGCCTG 
0 3 /TTCAAATGGAACCCCAGATGAAGTCCATGACTAAGATCTACCGTGGACCCCTGGACCGGCCTA 

0 4 /TTAAAATAGAGCCCCAGATGCAGTCCATGGCTAAGATCTACCACGGACCCCTGGACCGGCCTG 

0 1 /CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCTCAGCTGCAC 
02/CTAGCCCATGCTCTGATGTTAATGACATCAAAGGCACCCCTCCCGAGGAAATCTCAACTGCAC 
0 3 /CTAGCCCATGCTCCAATTGTAATGATATCGAACGCACCCCTCCCGAGGAAATCTCAACTGCAC 

0 4 /CTAGCCCATGCTCTGATGTTGATGACATTGAAGGCACGGCTTCCGAGGAAATCTCAACTGCAC 

0 1 /AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCC 
0 2 / AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGTGGTTGTTGGCCAACCTCCCC 
0 3 / AACCCCTACTATGCCCCAATTCCGCAGGAAGCAGTTAGACTGGTCGTCAGCCAACCTCCCC 

0 4 /GACCCCTACTACACCCCAATTTAGCGGGAAGCAATTAGAGCAGCCT ATGGCCACCTCCCC 
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CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 3 

CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 4 

CTTCCCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGG 5 

CTTCTCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGG 6 

CTTCCCCAAATAATAAGAACCCCCC-TTCAACCCAAACGGTCCAAAAGGAGATAGACAAAGGG 7 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG — 3 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCC7CCAAGCGGTGGGAG — 4 

GTAAACAGTGAACCAAAGAGTGCCAATATTCCCCAATTATGACCCCTCCAAGCAGTGGGAGGA 5 

GTAAACAATGAACCAAAGAGTGCCAATATTACACGATTATACTCGCTCCAAGCAGTGGGAG — 6 

GTAAACAACTAACCAAAGAATGCCAATATTCCCCGATTATGCCCCCTCCAAGCGGTGGGAG — 7 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 3 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 4 

AGAGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAG-ACTTAAAGCAAATAAAA 5 

-GAGAATTTGGCCCAGCCAGCGTGCATGTACCTTTTTCTCTCTCAG-ATTTAAAGCAAATTAAA 6 

-GAGAATTCGGCCCAGCCAGAGTGCACGTACCTTTTTCTCTCTCTAGACTTTAAA TTAAA 7 

ATAGACNTAGGTNAATTNTCAGATAGCCCTGATGGYTATATTGATGTTTTACAAGGATTAGGA 3 

ATAGACXTAGGTXAATTXTCAGATAGCCCTGATGGXTATATTGATGTTTTACAAGGATTAGGA 4 

ACAGACTTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 5 

ATAGACCTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 6 

ATAGACCTAGGTAAATTCTCAGATAACCCTAATGGCTATATTGATGTTTTACAAGGTTTAGGA 7 

TTCCTGAGTTCTTGCACTAACCTCAAAT 1 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 3 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 4 

CAATTCTTTGATCTGACATGGAGAGATATAATGTCACTGCTAAATCAGACACTAACCCCAAAT 5 

CAATCCTTTGATCTGACATGGAGAGATATAATGTTACTGCTAAATCAGACACTAACCCCAAAT 6 

CAATCCTTTGATCTGATATGGAGAGATATAATGTTACTGCTAAATCAGACACTAACCCCAAAT 7 

GAGAGAAGTGCCGCCATAACTGCAACCCAAGAGTTTGGCGATCCCTGGTATCTCAGTCAGGTC 1 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 3 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 4 

GAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTC 5 

GAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCGAACTCTGGTATCTCAGTCAGGTC 6 

GACAGAAGTGTCGCCGTAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 7 

AATGACAGGATGACAACAGAGGAAAGATAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 1 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 3 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 4 

AATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 5 

AATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 6 

AATGATAGGATGACAACAGAGGAAAGAGAACGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 7 

GTAGACCCTCATTAGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 1 

AACT 2 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTACTAACT 3 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTT 4 

CTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACATTTGCTAACT 5 

GTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACATTTGCTAACT 6 

GTAGACCCTCACTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 7 
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TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA TATGAATTATTCAATGATGTCCACT 1 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 2 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 3 

TGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCACA 5 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCCCT 6 

TGCGTGCTAGAAGGACTAAGGAAAACTAGAAAGAAGCCTGTGAGTTATTCAATGATGTCCACT 7 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 1 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 2 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 3 

ATAACACAGGG-AAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 5 

ATAACACAGGG-AAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAG 6 

ATAACACAGGG-AAAGGAAGAAAATCCTACCGCCTTTCTGGAGTGACTAACGGAGGCATTGAG 7 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGAAAAGTA 1 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 2 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 3 

G AAGCGTGCC2 3 2 AGGCAAGTGGACTTTGG AGGCTCTGGAAAAGGGAAAAGCTGGGCAAATTG 5 

GAAGCATACC238AGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAAGCTGAGCAAATTG 6 

GAAGCATACC2 3 3 AGGCAAGCGGACTTTGGAGGCACTGGAAAAGGGAAAAGCTAGGCAAATCA 7 

TATGTCTAATAGGGCTTGCTTCCAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 1 

AATGCCTAATAGGGCTTGCTTCCAGTGCAGTCTACAAGGACGCTTTAGAAAAGATTGTCC-AA 2 

AATGCCTAA 3 

AATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 5 

AATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 6 

AATGCCTAATAGGGTTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCCAAA 7 

-TAGAAATAAGCCACCACCTCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 1 

GTAGAAATAAGCCGCCCC-TCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCTACT 2 

GTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACT 5 

GTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 6 

-TAGAAATAAGCCGCCCCCTCGTCCATGCACCTCGTGTCAAGGGAATCACTGTAAGGCCCACT 7 

GCCCCAGGGGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 1 

GCCCCAGGGGACGAAGGTCCTCTGAGTCAGAAGCCACTAACCTGATGA 2 

GCCCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 5 

GCCCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAA 6 

GCCCCAGGGGACGTAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 7 



FIGURE 9.2 



WO 99/67395 



PCT/FR99/01513 



12/64 

RTPLSTQTVQKDIDKGVNNEPKSANI PWLCTLQAVGEEFGPARVHVPFSLSHLKQI KI DG SDS?: 



KDP P STQMVQ KE I DKR VN SE PKS AN I PQLPLQAVGGR£FGPARVHVPFSLPDLKQ I KTDLGKFSDNPDG 
YIDVLQGLGQSFDLTWRDIILLLNQTLTSNERSAAITGAREFGNLWYLSQVNDRMTTEERERFPTGQQ 
YIDVLQGLGQFFDLTWRDIMSLLNQTLTPNERSATITAAXEFGDLWYLSQVNDRMTTEEREXFPTGQC 
AVPSVAPHWDTESEHGDWCRRKLLTCVLEGLRKTRK TMNYSMMSTITQGK 



AVPSLDPHWDTESEHGDWCCRKLLTCVLEGLRKTRKKSMNYSMMSTITQGR 
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G7C7ACC7AGCCA-AGGCA7A7TC77CTTA7G7GGAACA7CAACC7A7A7C7GCCTCCCCAC7AACTGGA 

GTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCGTTGTTTGA--A-TGGCTCTT 
CAGGCACC-TGAACCTTAGTCT — TTCTAAGTCCCAAC-ATTAACATTGCCCCAGGAAATCAGACCC-TA 

CAGAATCTATGTGC-TTCCTCTCATTCTTAGTGCCCCCTATGACCATCTACACTGAACA--AGATTTATA 
TTGGTACCTGTCAAAGCTAAAGTCCCGTCAGTGCAGAGCCATACAACTAATATCCCTAT-TTATAGGGTT 

CAGTTA— TGTCATATCTAA-GCCCCGCAACAAAAGAGT-ACCCAT-TC-T-TCCTTTTGTTATAGGAGC 
AGGAATGGCTAC-TGC7AC-AGGAACTGGAA7AGCCGG777A7C7ACTTC-A77-A-TCCTACTACCATA 

AGGAGTG-CTAGGTGC-AC7AGGTACTGGCA77GGCGGTA7CACAACC7C7ACTCAG77C7AC7ACAA-A 
CACTCTCAAAGAATTTCTCAGACAGTTTGCAAGAAATAATGAAATCTATTCTTACTTTACAATCCCAA-T 

CTATCTCAA-GAACTAAATGGGGACATGGAACGGGTCGCCGAC-TCCCTGGTCACCTTGCAAGATCAACT 
TAGACTCTTTGGCAGCAAT-GACTCTCCAAAACCGCCGAGGCCCACACCTCCTCACTGCTGAGAAAGGAG 

TA-ACTCCCTAGCAGCAGTAGTC-CTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
GACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGGATAGT-AC-GAGAT-GC 

GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGT 
CACCTGGCATTT-ACAGGAAAGGGCTTCTGATATCAGACAATGCCTT7CAAACTC7TATACCAA— CCT 

TAAA-GAAATTCGAGATCGAATA-CAACGTAGAGCAGAGGA-GC-TTCGAAACACTGGACCCTGGGGCCT 
CTGGAGT TGGGCAACATGGCTTCTTCCATTTCTAGGTCCCATGGCAGCCATCTTGCTGTTACTCACC 

CCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGC7ATAATATTGCTACTCCTC 
7T7GGGCCC7G7A77T77AAGC77C77G7CAAA777G777CC7C7AGGATCGAAGCCA7CAAGC7ACAGA 



777GGACCC7G7A7C777AACC7CC77GT7AAC777G7C7C77CCAGAA7CGAAGC--7 G-7AAA-A 

7GG7C77ACAAATGGAACCCCAAATG-AG77CAAC7AACAAC77C7ACCAAGGACCCC7GGAACGA7CCA 

C7-ACAAATGGAGCCCAAGATGCAGTCCAAG-ACTAAGATCTACCGCAGACCCCTGGACCGGCC7G 

CTGGC— AC7-7CC-AC-7-A— GCC-T-AGAGATTCCCCTCTGGAAGACA-CTACAACTGCAGGGCCCC 



C7AGCCCACGA7C7GA7G77AA7GACA7CAAAGGCACCCC7CC7GAGGAAA7C7-CAGC7GCACAACC7C 
77C777GCCCC7A7CCAGCAGGAAG7AGC7AGAGCGG7CA7CGGCCAAA77CCC-AACAGCAG77GGGG7 

7AC7ACGCCCCAAT7CAGCAGGAAGCAG77AGAGCGG7CG7CGGCCAACC7CCCCAACAGCAC77AGG77 
G7CC7G777AGAGGGGGG 



77CC7G77GAGA7GGGGG 
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ACCTTG CAAGATCAACTT A - ACTCCCTAGCAGCAGT - AGTCCTTCAAAATCG AAGAG CTTTAGACTTGCT 



ACTTTAC AATCCCAAATAAGACTCTTTGGCAG CAGTG ACTC - TCCAAAACCGCTGAGGCCTAGATCTCCT 
AACCGCTGAAAGAGGGGGAAC CTGTTTATTTTTAGGGGAAG AATG CTGTTATT ATGTT AATCAAT CCGGA 



CACTGCTGAAAAAGGAGGACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGOT 
ATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAAT A - - CAACGTAGAG CAG AGGAGCTTCGAAACAC 

ATAG - CA - TGAGAT - GCCACC CAGCGTTTACAG - GAAAAGGCTTCTGAAATCAGACGCCTTTC - AAATTC 
TGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATA 



TTATACCAA CCTCTGGAGT TGGGCAACATGGCTTCTCCCCTTTCTAGGTCCCGTGGCAGCCATC 

ATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAG 



TTGCTGTTACTCGCCTTTGGGCCCCGTATTTTTAACCTTCTTGTCAAATTTGTTTGGTCT 

C- -T- - -G-TAAA-A CT - ACAAATGGAGCCCAAGATGCAGTCCAAG - ACTAAGATCTACCGCAGAC 

CCATCAAGCTACAGATGGTCTTACAAATCGAACCCCAAATG - AGTTCAACTAACAACTTCTACCGAGGAC 
CCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAG - GCACCCCTCCTGA - GGAAATC 

CCCTGGACTGACCAGCTGGC - - ACT - TCCCCTG GCC-T - AGAGAGTTCCCCTC - TGAAGG AC A - C 

T-CAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCC^CCTC^ 



TACAAC7GCAAAGCCCCTTCTTCGCCCCTATCCAGCAGGAAGTAGCTAGAGCAGTCATCGGCCAAATTCC 
CCAACAG CACTT AGGTTTTCCTGTTGAGATGGGGG 



C - AACAGCAGTTGGGGTGTCCTGTTGAT - TGAGGG 
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agttgcaattccttgcctcaactctgagagaaaccccagccacatctccagcaaacaaga 

Ililll MIIIIMIIIII III Mill MINIMI INIIIIIIIiil IIIIII 

agttgcaattccttgcctccactgtgagacaaaccccagacacatctccagcacacaaga 22 99 
acttcaaaacacctgaactgcagcagccaggcgttcctccaggaccacctcccccaggat 

INN III III III III IIIIII lillllllll III NINIINN 

acttcgaaatgcctcaacctcaggtgccaggggttcctccagaaccttctcccccaggag 23 59 
cttgcttcaagtgccggaaatctgaccattgggccaaggaatgcctgcagcccaggattc 

IIIIII M 1 1 1 1 1 1 f I M 1 1 1 1 III INIINNNIINI III i 1 1 M 1 1 1 1 

cttgctacaagtgccagaaatctggccactgggccaaggaatgcccacagaccaggatcc 2419 
ctcctaagccacgtcccatttgtgcaggaccccactggaaatcggactgtccaactcacc 

Illllllll MINI I II lillllllll lllll IIIIII lllilllll 

ctcctaagctgtatcccatctctgtgggaccccactaaaaatcagactgttcaactcacc 24 79 
cggcagccaatcccagagcccctggaactctggcccaaggctctctgactgactccttcc 

llllllll I lllllll Milllillll I lillllllll Mlllllllll lllll 

tggcagccacttccagagcccctggaactctagcccaaggctctctgactgaccccttct 253 9 
cagatcttctcggcttagcagctgaagactgacactgcccgatcacttcagaagtcccct 

Illllllll III Mil! lllllll lillllllll I II INI I II INI I I 

gagatcttcttggcttagcagctgaagactgacactgccagatcgcctcggaagcctaca 25 99 
ggaccatcacggatactgagcttcaggtaactctcacagtggaggctaagtccatcccct 

lillllllll IN III II I IIIIII INI INI INI IIIIII IIIIII 

ggaccatcacagat gctccaggtaactctcacagtagagggtaagt ctgtcccct 2654 

gtttaatcgatacaggggctacccactccacatcaccttcttttcaagggcctgtttccc 

IIIIII IN I lllllllllll lllll II MIIIIMIIIII IIIIMIMI 

tctcaatcaatatggaggctacccactgcacattaccttcttttcaagggcctgttccct 2 714 
tttcccccataactgttgtgggtattgacggccaagcttcaaaaccccttaaaactcccc 

II II lllllll Mill IIIIII Mill MM INN lllll lllllllllllll 

ttgcctccataactgttgtgggtattgacggccaggcttctaaacctcttaaaactcccc 2774 
cactctggtgccaacttggacaacattcttttatgcactctttttcagttatcctcacct 

lllll II lllllll INN I lllllll IIIIII INI MMMM III I 

aaccctagtaccaacttagacaatactcttttaagcactcctttttagttatccccactt 2834 
gcccagttcccttattaggccgagacattttaaccaaattatctgcttccccgactattc 

1 1 IN II INI II 1 1 lllllllllll II III lillllllll IIIIII llllllll 

gcccagttcccttatgaggccgagacacttcaactaaattatctgcttccctgactattc 2894 
ctgggctacagccacatctccttgccgcccttcttcccaacccaaagcctccttcatatc 

INI lllllll lllllll II 1 1 IIIIIIIIMIIII lllllllllllll III 

ctggactacagctacatctcattgctgcccttcttcccaatccaaagcctcctttgcatc 2954 
ttcctctcatatccccccaccttaacccacaagtatgggacacctctactccctccctgg 

IN I I lllllll MMMIMMMIMM II lllllll lllllll III 

ttcttgt — accccccaacctcaacccacaagtacaagatacctctattccctccttgg 3011 
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caaccgatcacacgcccattactatcccattaaaacctaatcacccttaccctgctcaat 

hi in i i hi 1 1 1 1 hi 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 iiiiiii iiiiiii 

tgaccaatcatgcaccccttaccatctcattaaaacctaatcactcctacccggctcaat 3071 
gccagtatcccataccacaacaggctttaaagggattgaagcctgttatcacttgcctgc 

Mil IIIIIII Mill II 1 1 1 1 1 1 ! i Mill II M I ! 1 1 ! 1 1 1 1 1 MUM 

gccaagatcccatcccacagcatgctttaaaaggattaaaacctgttatcactcgcctgc 3131 
tacagcacgggcttctaaaacctataaactctccatacaatccccccattttacctgtct 

II Mil II III MM i 1 1 1 1 1 1 1 1 ! I i 1 1 1 1 1 1 M 1 1 1 1 ( 1 1 1 1 ! 1 1 1 1 1 1 1 1 

tagagcatggccttttaaagcctataaactctccttacaattcccccattttacctgtcc 3191 
aaaaaccagataagtcttacaggttagttcagaatctgcaccttatcaaccaaattgttt 

I IIIIIII III 1 1 1 1 1 1 M I III Mill llllllll lllllllll 

tagaaccagacaagcct tacaggtt caggatctgtgtcctatcaatgaaattgttt 324 7 

tgcctatccaccctgtagcacccaactcgtacactcttttgtcctcaatgccttccccca 

I llllllllllllll I I Ml I II Mill I llllllll III II I I 

tccctatccaccctgtggtgctgaacccatatactctcctatcctcaatacctccctcta 3307 
caactcactattccgttcttgatcttaaagatgcttttttcactattcccctgcacccct 

1 1 II M IIMI Mill Mill III IIIIIII II IIMI II I Mill I 

caacccattattctgttctagatctcaaacatgctttctttactatccctttacaccctt 3367 
catcccagcctctctttgcttttacctggactgaccctgacacccatcagtcccagcagc 

II III IIIIMIIII I Ml III I Ml I IIIIIIIIMIIM M Ml IIMI I INI 

caacccagcctctcttcgttttcacctggactgaccctgacacccatcagtcccagcagc 3427 
ttacctgggctgtactgccgcaaggcttcagggacagccctcattacttcagccaagctc 

IMMIIIIIIIII III MUM IIIIIII IIIIIII MM lllllllllllll 

ttacctgggctgtaatgctgcaaggtttcaggggcagcccttattatttcagccaagctc 348 7 
tttctcatgatttactttctttccacctctctgcttctcaccttattcaatatattgatg 

M 1 1 ill 1 1 II 1 1 II 1 1 1 Mi 1 1 ! II I Ml IIIIIIIIIIIIIIIIIMIIIII 1 1 

tttctcatgatttactttctttccacccctccacttctcaccttattcaatatattggtg 3 54 7 
accttctactttgtagcccctcctttaaatcttctcaacaagacaccctcctgctccttc 

I MM MM IIIIMIIIIIII! I II llllll II Ml MM I II llllllllll 

atgttcttctttgtagcccctcctttgaatcttctcaacaagacacacttctgctccttc 3607 
aacatttgttctccaaaggatatcgggtatccccctccaaagctcaaatttcttctccat 

I Mill MMIIMIMIIMI IMMIMIMMIMM lllllllll! 

agcatttattctccaaaggatatc cccctccaaagctcaaatgtcttctccat 3660 

ctgttacatacctcggcataattcttcatgaaaacacatgtgctctccctgccaattgcg 

I Mill Mill I i F 1 1 1 1 1 1 f 1 1 1 1 1 llllllll MM llllllll II I I 

ccgttacctaccttggcataattcttcataaaaacacacgtgccctccctgctgatagtg 3720 
tctccaactgatctctcaaatcccaacctcttctacaaaacaacaactcctttccctcct 

Ml IIIIMIIIIIIII IIIIIII llllllllllllllllllll IIMI Mil 

tctg--actgatctctcaaaccccaaccccttctacaaaacaacaactcttttccaccct 3778 
aggcatggttggatacttttgcctttggatacctggttttgccatcctaacaaaatcatt 

I MIIMIIIIIIIIII II I II 1 1 1 M i 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 KM 

aggcatggttggatactttcgtgttaggatacctggttttgccatcctaacaaaaccatt 3838 
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atataaactcacaaaaggaaacctagctgaccccatagattctaaatcctttccccactc 

MIMI II MMII II Mil lllll I lllllllllllll llllll! II II 1 1 1 1 M I 

atataaactcacaaaaggaaacctagttgaccccatagatcctaaatcgtttccccactc 38 98 
ctctttccattccttgaagacagctttagagactgctcccacactagctctccctgtctc 

mill ii iiiiM i mil inn n iimiM im iiiiiiiimii m 

ctctttccattccttgaagacagctttagagactgtctccactccagctctccctgactc 3958 
atcccaacccttttcattacacacagccgaagtgcagggctgtgcagtcggaattcttac 

1 1 1 1 1 1 1 1 iiiiiiiiimiiim m mi i im immi i ii iiiiiiini 

atcccaacacttttcattacacacagctgaagtgcagggctgcgcagtcagaattcttac 4018 
acaaggaccgggaccatgccctgtagcctttttgtccaaacaacttgaccttactgtttt 

lllllllllllll I 1 1 1 1 1 1 II 1 1 1 II I II M 1 1 1 ! I II I M 1 1 1 1 1 1 M I II 1 1 

acaaggaccgggatcgcatcctgtagcctttttgtccaaacaacttgaccttactgtttt 4078 
aggctcgccatcatgtctccatgcggtagcttccgctgccctaatacttttagaggccct 

inn iiiimiiiimiiii i ii i n ii urn 1 1 m m mil i n 

aggctggccatcatgtctccatgcagcgtctgctgccaccctaatacttttagaggccct 4138 
caaaatcacaaactatgctcaactcactctctacagctctcacaacttccaaaatctatt 

IIIIIIIIIIIIIIIIIIIIIIIIII I III II I II II Ml I II II IMMI llll II 

caaaatcacaaactatgctcaactcattctctacagctctcataatttccaaaatctatt 4198 
ttctttctcacacctgacgcatatactttctgctccccggctccttcagctgtattcact 

Mill I i II 1 1 1 1 1 1 1 1 i 1 1 1 M 1 1 1 1 1 1 M j 1 1 1 1 1 1 1 1 i M II 1 1 I II Mill 

ttcttcctcacacctgacacatatactttctgctccccggctccttcagatatactcact 4258 
ctttgttgagtctcccacaattaccattcttcctggcccagacttcaatctggcctccca 

i n i iiiiiiiiimiiim imiiiii iiiiiiini iiiiiim 

c- -catttattctcccacaattaccattattcctggcctggacttcaatccggcctccca 4316 
cattattctggataccacacctgaccctgatgattgtatgtctctgatctacctgacatt 

MM III MM MM II llllllllll llll II II lllllllll IIIIM II 

cattattctggataccatacctgaccctcatgactgcatctctctgatccacctgacgtt 4376 
caccccatttccccatatttccttcttttctgttcctcatgttgatcacatttggtttac 

iiiiiiiiMiiiii iiiiiiiiii iiiii iiii mum iiiiiim 

caccccatttccccacatttccttctgccctgtttctcaccctgatcacacttggtttat 4436 
tgacggcagttccaccaggcctgatcgccactcaccagcaaaggcaggctatgctat 

III llllllllllllllllll 1 1 1 1 1 1 1 M 1 1 1 1 1 1 ! 1 1 1 1 1 1 M I M 1 1 1 1 1 1 

tgatggcagttccaccaggcctaatcgccactcaccagcaaaggcaggacatgctat 4493 
gaactgattgccttaactcgggccttcactcttgcaaagggactacacgtcaatatttat 

inn iiiimii n m iiiimiimi mini mum in 

gaactagttgccttaattcaagccctcactcttgcaaaaggactacgtgtcaatatctat 4553 
actgactctaaatatgccttccatatcttgcaccaccatgctgttatatgggctgaaaga 

inn 1 1 1 1 1 1 1 1 1 1 1 1 1 1 inn miiiimm n miiniiiiiiii 

actgattctaaatatgcctttcatattctgcaccaccatgcggtcatatgggctgaaaga 4613 
ggtttcctcactacgcaagggtcctccatcattaatgcctctttaataaaaactcttctc 

iiiiiiiiiiiiii iiii iiiiiiiiiiiiMMi iiiiiiiii mi iiii in 

ggtttcctcactacacaagtgtcctccaccattaatgcctctetaagaaaa-ctctgctc 46 72 
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aaggctgctttacttccaaaggaagctggagtcacacactgcaagggccaccaaaaggcg 

iiiiiiiiiiimiiiiiiimiiiii mi iiiiiniiii ii mill i 

aaggctgcttcacttccaaaggaagctggggtcattcactgcaaggggcaccaaaagact 4 732 
tcagatcccattactctaggaaatgcttatgctgataaggtagctaaagaagcacctagc 

iniiiiiiiii iiiiiii iiiiiiiiiiiiiiiiiin mi i inn inn 

tcagatcccattgctctaggcaatgcttatgctgataaggtggctagacaagcagctagc 4792 
gttccaacttctgtccctcatggccagcttttctccttcccatcagtcattcccacctac 

1 1 mi ii n mi 1 1 in i inn ii ii n in 1 1 i it i mi riiimin 

tctccaacttttgtccctcatggccagtttttctccttcacatccgtcactcccacctac 4852 
tcccccattgaaacttccgcctatcaatctcttctcacacaaggcaaatggttcttagac 

in i ininiiii niiini Mini i i inn iiiiiinii inn 

tccacagctgaaacttccacctatcaagctcttcccccgcaaggtaaatggttcttagac 4912 
caaggaaaatatctccttccagcctcacaggcccattctattctgtcatcatttcataac 

1 1 1 1 1 II I III II 1 1 II II II I! I llll ! II II 1 1 Ml I M II IN ! Illllllllll! 

caaggaaaatatctccttccagcctcacaggcccattctattctgtcgtcatttcataac 4972 
ctcttccatgtaggttacaagccactagtccacctcttagaacctctcatttcctt-cca 

II 1 1 II M 1 1 1 1 j I M 1 1 1 1 1 1 i 1 1 1 1 I lllllll llll M|||! M| 

cttttccatgtaggttacaagccactagcctgtctcttaggacctctcattccctttcca 5032 
tcgtggaaacatatcctcaaggaaatcacttctcagtgttccatctgctattctactacc 

ii iiiiii MMiiiiiiii i i 1 1 : 1 1 1 1 1 1 1 1 j 1 1 m 1 1 1 [ 1 1 1 1 1 1 1 1 inn 

tcatggaaatctatcctcaaggagatcacttctcagtgttccatctgctattctgctacc 5092 
cctcagggattgttcaggccccctcccccccctacacatcaagctcggggatttgcccct 

i mil MiiiiiMi mm iiiiii i mnim mimi iiiiini Mini 

cctcagggattgttcaggcctcctccctttcctacacataaagctcggggatttgcccct 5152 
gcccaggactggcaaattgactttactcacatgccctgagtcaggaaactaaaatacctc 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 i inn iiimmii in 

gcccaggactggcaaattgactttactcacatgcctcgggtcagaaaactaaaatatctc 5212 
ttggtctgggtagacactgtcactggatgggtagaggcctttcccacagggtctgagaag 

ii 1 1 1 1 m 1 1 ii 1 1 1 1 1 limn i ii 1 1 1 1 1 m ii 1 1 m i ii ii niiimn 

ttagtctgggtagacactttcactgggtgggtagaggcctttcccatagagtctgagaag 5272 
gccactgcagtcatttcttcccttctgtcagacataattccttgggttggccttcccacc 

Mill I! II 1 1 1 1 1 1 1 II I i II 1 1 1 II 1 1 II 1 1 1 II I llll 1 1 Illllllllll I 

gccaccgcggtcatttcttcccttctgtcagacataattccttggtttggccttcccttc 53 32 
tctatacagtccaataacggagcagcctttattagtcaaatcacctgagcagtttttcag 

Illllllllll 1 1 M ! 1 1 1 IIIMMII llll IIIIMM M I II II I mi 

tctatacagtctgataacggaccagcctttactagttaaatcacccaagcagtttctcag 5392 
gctcttggtattcagtggaaccttcgtaccccttactgtcctcaatcttcaggaaaggta 

II MM Mill MIMIMIIIMI II IIIIII III llll M III Mill I MM 

gctcttggtattcagtggaaccttcatatcccttaacatcctcaatcttcaggaaaggta 5452 
gaatggactaatggtcttttaaaaacacaccccaccaaactcagcctccaacttaaaaag 

n immiiimimi iiiiiii mm mimiimimmn 

aaaccgactaatggtctttcaaagacacacctcaccaagcccagcctccaactcaaaaag 5S12 
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TGCCTTTATTTCCGTAGGCTGGTCATATGGCGCTAGCACTCACATAAAGCTACCGAGGAG 

AGCGAATGAAACCAAAATCACTTTACCTTCACAGCACGAGGCCGTCGTCCCTCTCGATAT 

TTGGCCCGTGTGTCGCATACCGCCCTCTGGACGTGGTGATCAAATAAACTCCCTAGCTCC 

CCGCCGCTCGACGCCATCTTGCCTACTTTGATCCTCGCAGGGAGGACAACATCCGCCCTA 

CTGAGCTCCCTTTTATCC^TAAGAGAGCGGGATGAGTTAAGGAGTGCCAGGATTGGCTG 

GAGAATCGACAGCGTCGGCCATCGTTTCCTGCGTGCGAAGATTTGATGAACGAGGTGCCG 

CCCCCGAGCGGCTCGGCGGAGAGGCGCGGTGGGTGACAGAAGCTTTCTTGTCCCACCCAC 

TACAGGCTTACGGCAGGATGCGCAGCGGGGAGAGGGGGCGGGGCCGCAGGGGGCGGGGCC 

GATCGATCTCCTCCGGCTCCGACGTCCTCGGCCTG CCGGGTCCCGGGTCCTTTGCGGCGC 

TAGGGTGGGCGAACCCAGAGCGACGCTCCGGGACGATGTGGGGCAGCGATCGCCTGGCGG 

GTGCTGGGGGAGGCGGGGCGGCAGTGACTGTGGCCTTCACCAACGCTCGCGACTGCTTCC 

TCCACCTGCCGCGGCGTCTCGTGGCCCAGCTGCATCTGCTGCAG GTAACCTGCCGGCCCC 

GAGCCACCTGATCTTCAGCCTGGGGTCGGACGAGGCCGAAGCCTCTCAGGGACGCGGCGG 

GACACCGGCTGCCACCCGGGCGCCGCCGAAGCGCGCAGAGATCAGGGTCCCTCGACGGCA 

GGGCCCTTCTGGGTAGTCTCTGGATCCCACAAGTCCAGTGCAGCCCTGGGCTCGTCTTAT 

CCCAGGTCTTTTCACTTGGTGAAACTGAACCTAGAAACGTCCTAATATTCTACCACTGTT 

TTTATAAATATT CCTTATTCCAGGCTGGAAAAGCTC CTGAGAAG TGGTTTG TTTTT ATTA 

TTTTAAAAGGTGTTTTCCTTGCCAGCCATTTCCAGTTAACCTGCGCTGCTGCCGTCCGGG 

CCGCGAGAGCGGGACGCAGAGTTGTTGGCGGAGCCCCTGTCGGTTCCCGGGGACTAAGCA 

CCGCGTCCCATGAGCGGGAAAGGTTAATACAATGATGGTTCTGCCCTGCGTCGCTGACGC 

GGAACACAGCTGTAGTGTGTTAGGAACACATAACGTAGTTAAGATCACTTGAAGCTCTGC 

GATCAGTCGCCCTTCTGGACGTTGTGGTTAGGATGTTTCACAGTTCTAACCACTGGTGGA 

GATACAGCGTCCATATTTTCATAATTAAAAATAGAGGCACATGGTCTCACGAGTTTGAGT 

GTACTTATGGGGGCAAAAGGACGGCGTATTTGAAATCCTCATAAATCCTGGATGCATGGT 

ACCCACCAGTGGCTAATCTATGCAATGAATAGAGTTTGCAATAATTTCAAGCATCCCTTC 

TTTCCACTTGAGTTACTTCCCCATACCTAGGGGAAGATATTTTTGGTCCACTGAAAACAT 

GAGTTCAGCAGAATCCTCCTATCATCGTCGTTATTATTTTTTACCACTAAGTAGACAATC 

TTTTGGTTTTTGATGGGCTTTATGGCTAGAGACAAATCAGTCACTGTCACCAAGTTCCAG 

GTAGAAGTTGGTTCAGTGCTCTGTCAGCTTCGATGGGATTTTTCAACATGTTTTCAAATC 

TGCACTTAATAGTAGGAATGCTTTCTTACAGTAACTCTAATTTGATCCTAAGATGTAGTT 

GTTACCTTACATTCATCACTGTTTAAGAATTTAGTGGTCTTGATCTTTGTTTTAAATTTT 

GAGCCTTCGGGAAGTACTTATAAGAATTAATTCATGCATATCITTTTGAAATGTAAATGT 

CTTTAGCCCTGGAACAAATTGCTGTTTCTGTTCAGCCCATATTAGCAGAATAGGTCAACT 

TTACTTTCTAATTATCAATGTAATAAGTTTATTACTTTATAGATTCCATAAATCTATACA 

TTT ATT C CT C GAT GAATT AT AT AAAT TT AT AG AATT T ATG TTTT AT AG AAAATTTGG AAA 

GCATGGAAAATTATTAACAAGAAAATAAGTTACCCATAATCCCAGAACTTAGAGGTGACT 

AATGTTGACAGTTTGGATCAAATCTTCCAGTTTTGTTTCTAATCTTTATTTTTAACATAA 

ATGAGGTCCTGTATACACACGTACAGTTTTGTGTCCTGGTGTTTTTATTTAATGTTATTA 

TGAGTGTTTTA'iT'lTGTTAAAAGGT CATCATTTT AAGTTGTT AATT AGTAT TCTAG C AC A 

AATTTGCCATAATTTATTTAATTGTTTACTATGATTG AC CATTT AG ATTGT AC TTAATTT 

TTAGGCATTAGAAGTGATAAACTATATTTTAATCAGACGTTGAAAATAACACATCTTTGT 

TTAGAAAACATCATTTTATTTCTGGTTGTCTAGGATAGATTCCCAGAATTCTTGGGTTAG 

AGGCCATAGATAATTATGAAAGCAGAAAGATTCACAAGTTGGGAGTTAATACTTGAATTA 

CTTTATTTGGGGTGAAGCATTGAGTGCATAATACAGATCATGCAGTAATGGGAAGAAGGG 

TTGGAACAATGGTTTTCTGGCCTATGTCAGACTTACCTTGAAGCTTTTAAGAATACAGAT 

GTTCTGATCAACCCTCAGACCTATTAAATCAGACCTAAAATCTTAGGGAATAGGCTTTAG 

GCATCTCTAATTTTAAAAAATTTATTCAGGCTACTTGGATGCACAAAAGAGTTGAGACCT 

ACTGTCCTAGAATCATAGAATTTTAATGACGATAGAGACCTTAAGCATCTAGGTCGTTTC 

TGTACTTTT ACATGTAAGGAAACTGG CATTC CT AGG C CAGTAC CATTGCC ATG C AG CT AA 

TTTGCCCTCTTGTCTATAGCTCACTCTGCATCACCCAACCTACCGTTCTCACTGTTTCTT 

CTATAACCAATCTCCTTCCCACTTCTGTTCTCTTACTCATGCCATTCTTCCCTCAGTCAT 

TTTTCTTCCTTCCATACAAATTCCATGTCTTTAAAAAGGAATAATCCTACCTCCTCCACA 
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TAGCTTTCCAATTCTCTGTTGCCCACATTTGTCTCCCTTTCAATACTTCTCTGTTGTGTT 
ATGTG AC AC AT C ACATTTG AT AT ACT CTGT A CTG TG TTT C AAG T ATTG T ATT CT CTTG TT 
TACTCAAGTCATT ATTTCAGGACTG ACTACCCAGT AG ATGCTTTAAGTCAG G ATTTCTCA 
ACCTTGGCACTGTTGACATTTTGAGCTGGATAATTTTTTGTTTTGGGGGCTCT 
ATTTTAAGATGTTTAACAGCACCCTTGGCCTCTATCCAGTAGACGCCTGTACTGCCTCCC 
CC T AT CTGTGACAAC CAAAAAGGT CTT CAG ACATTG T C AG AT G T CT ACTG AAGGAC AAAA 
TCACCTCTGGTTGAGAACCACCGCTTCAACTAAGTTATC^ 

TG TGATTG CAG C AGGGGGAG AGG ATT CAT AT ACACAG TG AATG CAAACG AA CCT AAATCA 
CCATT CGGAT ATGG C CACAC AATTTT CATTT C C CTT GTG T TAG C AAG AG AT AC C CT AGGC 
TTTGGACCTGATTATTCCTAAGGCATTCTGATGTATGGTTTTACCrGCAGATTTCCTGGT 
AATACTGATACCTCAGTTTGGGTCAAAGAAGGTCAATTAATTGATTGATTTGATTTGACT 
CCTGGAAAAGACGCTCCTTTCTAGCTGTCTCTTTCTTCTCTTTACCTGAATAGCCAGGGC 
T CTGTGG TT C AAG TG AAG T ATTTTG ACAT AAAAATT AACTT AG AACATTGG T CTG CAG AG 
TTTGCTCAATATAACTGAGCACATATTGTGGCTTTATGGAGCTGGTTACTACTTTTTGAC 
CAAATAAATAATTAGAAGTATTTTTCCTCCTCAATAAGG TTCATTTTTCCTTTTTT CAGT 
GAGCTGGTAG AGTTTCCTTTTTTGATATTTC AGGG C ATCTTT C ATATTTC CATCTCTTAA 
GTTTCTTCATATGAAGTAGAATTTATCTGGATTATGTATTGCTGACTCTGATGAAAACCC 
ATAGAAAGCATCTGGGGCTTGATCACCTTCATTCTTGTAATAGCTCACACGGTTACAGCT 
GATATGGTAACTTAAGACTTTTGATTCCAAATCTAGGCAAAATACACTCAGTTGAAAGAA 
TTTGTGA.GCCAGAACAGTTGGACTGTTCTGTGAAAATTGTGAGAAAAATTACACAACTAA 
GTGATACATGATGATGGCTTTCTTAAATATAAAATTGTAATAACATGGTTAATTTCCAGT 
ACGTTATATTGTCCCAGAAGTGGCTCCAACATTGTTTGAAATTTGTCTCATTTAAAGAAA 
CATAAGCTGGCTATGGTGGCTCACGC CTGTAATCCCAGCACTTTGGGAGG C TGAGG CAGG 
CAGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTAAAACCCCATCTC 
TACTAAAAATACAAAAATTAGCCGGGCATTTGGTGGGGGCCTGTAATCCCAGCTACTTGG 
GAGGCTGAGGCAGGAGAATTGCTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCGAGATT 
GTCCCACTGCCCTCCAGCCTGGGTGACAGAGTGAGTCTCCGTCTCAAGAAAAAAAAAAAA 
AAAAGCAAGAAACATAAAGACTGGGCATGTTGGCTCATGCCTGTAATCCCAGCACTTTGA 
GAGACTGAGGTGGGAAGATCACTTGAGCCCAGGAGGTTAAGGCTGCAGTGAGCCGTGATT 
TTGCCACTGTACTCGAGCCTGGGCAACACAGTGAGATCCTGTCTCAGGAAAAAAAAAATT 
GCATGTAAATGAATGAATTTGATATTTAATATTTTAAATTATGAAAACTGTTCTGTAGAG 
ATGTAGATCTTGCCATGTTGCCCAGGCTGGCTTTGAACTTCTGGGCTC^AACAATCCTCC 
TGTCTCAGTCTCCCAAAGTATAAAGATTACACATGTGAGCCACTGCACCTGGCCTAATAT 
TTTT AACTT AATGAATTTATTTTGATATAAATAAATTAATAACACTGAAGCTTCCTGATA 
TAATAAGTCTTTTTGTGTGTGTGACGGGTTCTCACTCTGTTGCCCAGACTGGAGTGTAAT 
GGCACTATCATGGCTCACTGTAGCCTCAACCTCCCTGACTCAAGTGATCCTCCCACCTCG 
GCTTCCTGAGTAGATGGGACCACAGGCGTATGCCACCACACCTGGCTGATTTTTAAAATT 
TATTATTGATACATATTAATAAAATTATTTTTATTTTAAAAATGATATATGTGGCTGGGC 
ATGGTGGCTCATGCCTGTAATCCCGACAGTTTGGGAGGCCGAGGTGGGAGGATCACTTGA 
GACCAGGAGCTTAAGACCAGCCTAAGCAACATAGTGAGATCCCATCTCTATAGAAAAAAA 
AAATGGCTAGGTGTGGTGGTGTATGCCTATATTCCCAGCTACTCAGGAGACTGAGGTGAG 
AGGATTGCTAGAGCCCAGGAGTTTCAAGTTACAGTGACCTATGATTGTGCCAGTGCACTC 
CAGCCTGGGCAACAGAGCAAAATCCTGTCTCAAAAAAAAAAAAAGTTCGAAAATGCTTAT 
GATGCAATATAAGTAGTGGAAAAGGATATTAAATTGTGCCTATATGAACACAACTATATG 
AAAAACTTGCACATAGAGAAAAGGATTAACAAGAAATAGACCAAATTGTTCACATGGTTG 
TCTTGTTTGTGGAGAGAATATCAGTAGTTCATTTGTTTCCTTCCAAGTTTATATGTTTTC 
CGAGGTCTCTATAATGAGTTTGTAATTGTTTAATCATAGAAAACCCTTTTTTGGTCCTTG 
GCCACAAACTTACATGTTTTAATGTAATTGCTTTTTTAATGAGAATAAATGTTATATTTT 
GCTTTTTTAAAACCTATATTCCCATAGTTATATGAGCCCTTACAATTATTAAGAGGCTGC 
ATAATATAACGTTTCTGGAAGGGTACAGAAGAAACAGCAGTAATTACCTCTGAGAACAGA 
GACATGGCTTCACATTTTACCCTTTTGTACGTTTTGTGCTTTTGCCACATGCATTTATTA 
TTCTTCCAATAAATAAGTAAATAAATATGGATTGTATACTCCATCTGGTTGGTGTTTCAT 
AATTCTAAAATTATATTGCTACATTTTTAAAGATGATATGTGTTTCTACTTATTAACGTA 
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TATGTTAAAATAGTAAATTTATATCTTATTT 

ACAGTCTCAAGTGTTCACTATCATAGAAAATACTGCACAGATAGCTTTTGCTATAGTTTC 
rn ' riT CTTTGAATCGTTAATTGGGAATAAATGCrCAAATAGTTATATGTGGCTCAACTG 
CTATTTAAGTTTATTGACTGACTGCTGCCATTTTGAAl'TCTGAAGGGGTTGATTAAATTT 
ATAATGCTGCCATAAGAATATAAGGGTATTGGCTTCATTAGCATCCACCAGCATTGGGTG 
TTGGAAATGATTATAGATTTTTAAATGCTACAACAAATGTAGATAACAGAGAACTATCTA 
TAGAACTCTTTTTGGACATGTGAATTGTAATAATAGTTTATTCT 

AATGTATACGAAAACCTTITI'TCCTCTCATTTCTTATATGAATAG AATCAAGCTATAGAA 

GTGGTCTGGAGTCACCAGCCTGCATTCITGAGCTGGGTGGAAGGCAGGCATTTTAGTGAT 

GGGGGACAG GTAAGCACATGTGATGGCAATAA CTT TCTTCTAATATCACATAATATAGCA 

ATAGAAATAAAATTAAAAGTTTAGATTTTTTGTTAAAGGAGGTGAGATGTCACCT 

GTATGCTATTATGTAACTAGTCTAGGATATTGAAGCTGACTATACTCTGTTTTTAGGTCA 

TTATCTTGTAGTTTACCATACTCCCTACTTGCTTCTTATTCTACTATTTAACTCATTTTC 

CACATCC C CTAATTTTGGTTTCATGAAATTATTTTTCCTTCTGAATTACTAGGTTCTACT 

T AC T ATT ATT AAACTTT ATTT C TG AC ATATTTTAT AAC CTT C CATG G TCTC AC TTG ATT A 

AAAATAAAAAATTCAGCTGGGTGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGAGG 

CCAAGGTGGGCGGATAATTTGAGGTCAGGAGTTGGAGACCAGCCTGCCCAACGTGGTGAA 

ACCCCCCCTCTCTACTAAAAATTCAAAAATTAGCTGGGCATGGTGGCAGGTGCCTGTAAT 

CCCAGCTACTCAGGAGGCTGAGGCAGGAGAATTGCTTGAACCTGGGAGGTGGAGGTTGCA 

GTGAGCTGAGATTGCACTGCTGCACTTCAGCTGGGTGACAAGAGCGAAACAATGTCTTGA 

AAAAAAATAAAAAAT AAAAAATTCT ACAACAC AGG G TT ATT ATTT TT C C ATTTTTG TTTT 

CCCTTATGAGTTTAATATGTTTAGATTATAAACCTGAAAGCTTGAATACCTATGTCTATC 

TTTTGTTTTCTTATGTTTATCAAGTTATTCCTTTAAACATTTTCTAAACTGTAAGAATAA 

TGTGAGGCTGGGCTCAATGGCTTATGCCTGTAATCCCAGTGCTTTGGGAGGCCAAGGTGG 

GAGGACCACTTGAGGCCACGAGTTCAAGATTAGCCTGGCTAGGCAACATAGCAAGACCCT 

ATCTCTATAAAAAAATTAAAAAAATTAGCTGGGCATGGTAGCAAATGCTTGTAGTCCCAG 

CTACTCAGCAGACTGAGGTAGGAGGAATGCTTGAGACCAGGAATTTGAGTGACCTATGAT 

TATGCACTCCAGCCCGGGCAATAGCAAGACCCTATCTCTTAAAAGAAGAAGATGTAGTAA 

TAATACATATTCATTATAACTATTTTACCATTGAAAGTAAAAAATGAGTTTTTACCTTTT 

CCCAGTCCCATCCTCAGAATGGGGATCTCAGTAGACCTTTAGGATTGGAAGAATGAGATC 

ATTCATATTTTCTGCAATTATTACCCCACAAAATATTTCAG ATAC CTTTC CATGTATTAC 

AAACAATGTGCATTTAACATGTCTCTCTCTTTCTCTCTCTCTCTGTGTGCGTCTTCATGA 

TCCTCTGTTGCAGCCCTGCCAGTAAGACACTATCTCCTGAAGAATCACTGATAGGAACAG 

AAAGTGGACTGGCTAGGCCAGGAGTCCTTAGCTTCTTAGGGGGCAGGAGCTGCTTTGTGC 

TTT CT CAG AAT CAGAT ATAT ATGTGG ACTG AAACAT TTAAAAACAG AAT AG C CAAGGGT G 

CTATACGTTTAAAACTTATAT AGATGGGGCTAC ATTGCTCT CTATTACTAATTTCC CATG 

ACAATACACGAGAGTGCCATGTCTTTTTAACTTGTTTTGAGCACAGACTAATCTTGTTTA 

TG CATGTTTTT TGATGAG AAT AG G CT ACT CAT G AG AAATCT GT AAAC CT AAC ACTAG T C C 

CTTGCATACTCTAAATTGTTGCTAGAATCTTAAAATTTTAGCACCAGACGGACCTTAGAA 

ATCATTAACTTTGGTGCTTTGTTCTACAATACAAGGAGATGGAATATTTTACCCAGGATT 

GCTTAGCAGGTTACAGTTCTGCCCTCTGAGTACCCAGCACTTCCCTGTGGGCAACATCAA 

CTTCCTGATTTTCAAGTCTTAATTAGTACTC TGAAG AATCCTACTTGTTTTTAACT C CCA 

TTTGCTTTGAAGTGACTTTACCTGATTTTTTTAGATCCCTTATTGCAGCAATGCCACTAA 

GAAACTGAGTCTCTAGCTTCTTGGTGGGCAGGAGCTGCTTTGTGCTTGCTCAGAATCATC 

CTTTTCAGTAAGGGAGATATTGAAGAGAAATCTACTGAGGAGTCTGGGGGTGAGGCACTC 

AGGGAAATCCTGCTCCAGTCCACAAAAGCAGAGAGGAAGGGTTGGTTACCTAGAGTATTT 

AACATGCAGAGGCTTTGGATTTTACTCCTTTAATCCTTGGAAATGCCTATGGAAGGGGAA 

AGGAAGTAAGATGGTGACTCCAGCTTATAGACATACTAGTGTTACATATATTTAAACTAT 

AATAGGAGGGTATTATTAGTTTTACTTAACTTTCAACTGTGAAGGATTATACTTCTCAAT 

ATTTGTCTCCAGTGTCTATTTCAGTGTATTTTTCACTTTTCTTGAAGCAGCATGTCTGTT 

GOVAAACTTCTAGAAATAATGAGAATATTTATATATTAGATCAAGCCATAACTTGATGAT 

ATAGTCATTTCTTCTTATATTTTTTACTTACATTTTTACATTTTAATGATTACTTTCATT 

TTTGAAAAACATGTCATGCTGAGATGTATTTTTCTTCATTCTGTAATTAGTTATGAAACA 
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GTTTTTCCTAAAATGCTGAGTATATCAAGTCTTGGCTAAGAATAAGTAATAAATATTTGC 
CACATGAAAGACTACACATATAGCCAGGTGCAGTGGCTTGCACCTGTTTTCCCAGCTACC 
CAGGAGGCTGAGGCAGGAGGATTGCTTGAGCCCAGGGTTTCCAGGCTGCAGTGAACTATG 
ATTGTACCACTCTACTCCAGAATGGGTGACAGAGCCAGGCCCCATCTCTCAAAACAGAAA 
AGAAAG ATT ACAT AGACTAC ATATAC ACCCC C ATCC AAAAC AT AC AC AC AC ATCT ACTT A 
ACCTAAAATGGTAAGAAGATAACTTCTTATTTTCTAATATATGACACAGAAAAGTTTTTT 
TAAAGTAGri-riAAAri'rriAATT^ 

TATCTTGTCAACAAGTTGAGGTGGAACCCCTCTCAGCAGATGATTGGGAGATACTGG TAA 
AG AAAAC CAAATAAGAA CT AT C T CATTT AAG G TT AAATT AC TT C AC AAT AT C AATG T CTT 
TAGCTTTCTCTAAGCTTTATTATATATTCTGAGTTGGTTTTGAATTATAAGAATGAATTG 
GGGCCAGGCACAGTAGCTCATGCCTATAGTCCCAGCACTTTGGGAGGCCAAGGCAGGTGG 
ATTGCTTGAGTC CAGGAGTTCAAGAC CAGGCTGG GC AACATGGTGAAAC CC CGTAT CTAC 
TAAAAATACAAAAATTAGCCAGGCATGGTAGTGCATGCCATTAGTCCCAGTCACTTGGGA 
GGCTGAGGCAGGAGAATCGCTTGAGCCCGTAAAGTCAAGGCTGCAGTGAGTCAGGATCTT 
G CCATTGT ACTC CAGTCTGGAAAACAGAGTGAG AC CTTGTCTC AAAT AAAAAAAG AATG A 
ATTGATAGAGATCTAATGTACAACCTGACAACTATAGGTAATAAAATTGTATTGGGGATT 
CATGTTAAATGAGTAGATTTTAACTACTCTTACCACAAAAACACAAAAGTGGGTAACTGT 
GAGATGATGTAT ATGTTAATTTACTTCACTAT AGTAAC CATTATACT ATCT AT ATGT AG C 
TCATAACACCATGTCGTGTAT ATT AAAT ATG C ACATTAAAATTTGTTTT TT AAAAAAAGA 
ATTGAGATTTTTTTTAACTAGATATGGAGTGGACAAAATGTAAAGTGAATTGATCTTTTC 
GTCTGTTGGTTCTAG GAG CTG CATGCTGTTTCC CTTGAACAACATCTTCTAGATC AAATT 
CGAATAGTTTTTCC AAAAG C CATTTTTCCTGTTTGGG TTG ATC AAC AAACGTAC AT ATTT 
ATCCAAATTGG TAGGTGCTATTGTAATATTTGCTGTCATATTCTACACTATAGCATTGAG 
T C CAAAGT AGAAATG AATGTG CACT AATG AG CTTT ATTTT C T AC ACAGTTG CAC T AAT AC 
CAGCTGCCTCTTATGGAAGGCTGGAAACTGACACCAAACTCCTTATTCAGCCAAAGACAC 
GCCGAGCCAAAGAGAATACATTTTCAAAAGCTGATGCTGAATATAAAAAACTTCATAGTT 
ATGGAAGAG ACCAG AAAGGAATGATG AAAGAACTTC AAAC C AAG C AACTTC AGTC AAATA 
CTGTGGGAATCACTGAATCTAATGAAAACGAGTCAGAGATTCCAGTTGACTCATCATCAG 
TAGCAAGTTTATGGACTATGATAGGAAGCATTTTTTCCTTTC^ 

AGACATCTTGGGGTTTAACTGAAATCAATGCATTCAAAAATATGCAGTCAAAGGTTGTTC 
CTCTAGACAATATTTTCAGAGTATGCAAATCTCAACCTCCTAGTATATATAACGCGTCAG 
CAACCTCTGTTI1TCAT AAACACTGTGCCATTC ATGTATTT C C ATGGG ACC AGGAATATT 
TTG ATGTAG AGC C CAGCTTT ACTGTG AC ATATGGAAAGCTAGTTAAGCTACTTTCT CC AA 
AGCAACAGCAAAGTAAAACAAAACAAAATGTGTTATCACCTGAAAAAGAGAAGCAGATGT 
CAG AGC CACT AG AT CAAAAAAAAATT AGG T C AG AT CAT AAT G AAG AAG ATG AG AAG G C C T 
GTGTGCTACAAGTAGTCTGGAATGGACTTGAAGAATTGAACAATGCCATCAAATATACCA 
AAAATGTAGAAGTTCTCCATCTTGGGAAAGTCTGGGTTAGTATAAATTTTATAACTTGGG 
AGAAATTTTATGTGGCTTAAACATCCCCAAATTATGAATTAGAATAGTATTTCATATATA 
AATTGAAAATCAATTAAAAAGAAACACAGTGCCTAAAGGCACTTGGGGGACACATTTACG 
CTTTGCAGTAAAGTCCTTGTTTGGATAAAGATTGTATGTTTTCTGGCCAAGTAAGCTTGA 
ATAGGTACAAGCTTAGATAGGTTCAGGCCAGAGAGGTCAAAATTACTTGCCTGAGATTGC 
ATAGCTAGTGTTACAACTAGGATTCAAACCCAGGCAGATTGACTTGGGGGTTCATCAGGA 
TGGAGTGCCCTACAAAGCCTCCCATCTTTAATGCTTGCAGATTTGTTCCCCAGTTACCGA 
AAGCAACTTGTTAATATTAGGGAAAAGGGCCAGTGTAGGGAGAGATCCATGGCATGAGGT 
AACCTTCCTGCTGCATGTGGTGGCACCTGGATTGGAATGCATCCAGGAGCTGCTTACCCT 
GCCGGTGTCTGCTCTTTAATTTGTGTATAACGGAGAGGAAGTAGACAGGGCAACTAGTGC 
TCCAGCCCCTCATCCTGGCCACAAATATTAATCCTACCTTTATATGACATAAGTCACTAG 
TCCATTTATTGGAACCTAAATTTGAACCACTGTAAAGTAAGACTTCATAGTGATAAAGAG 
AGGAACTTGTTAGGAAAGAGAATAAAATAGAAAGAGAAGGTTGTCTCCTTTTGTAGATTT 
TTTrT , ITl"l'L"rCCAACAGl w riTACCTGTGACL u rrrATACAAATAACTGACAAAGCATTAA 
TCTCTTTGGCCTACATCATTTTCTTTTCTATTTTTTITTTCCACAAGATGGAGTTTCACT 
CTTCTTGCCCAAGCTGGAGTGCAGTGGCATGATCTGGCTCACTGCAACCTCCGCCTCCCA 
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CGTTCAAGTGGTTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCATGCACCAC 
CACGCCTGGCTAATTTTTTGTATTTTTAGTAGAAACTGGGTTTCACCATGTTAGCCAGCC 
TGGTCTGGAACTCCTGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGAT 
TACAGGCATGAGCCACTGCTCCTGGCCGGCCTACATCATTTTCTAAAGCTCCAGACCATT 
C'l*'l M l' - l l Cr , l"l"l , <J'r'l''l"r C T'l' r l'CUTl"l"rCTTTTCTTTTCTTTTCTTTrrCT , r*I"TCTTTTTTCTC 
TTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTTTCTTTTCTTTTTTTGAG 
TTAGAAGCTTGCTTTGTTGCCCAGGCTGGAGTGCAGTGGCACCACCTCCACTCACTACAA 
CCTCCACCTCCCAGGTTCAAATGATTCTCCTGCCTCAGCCTTCAGAGTAGCTGGGACTAC 
AAGTGTGCGCCACCACTCCTGGCTAATTTTTGTATTTTTAGTAGGGACGAGGTTTCACCA 
TGTTGGCCAGGCTAGTCTTGAACTCCTGGTCTCAAGTGATCCGCCTGCCTCAGTCTCCCA 
AGGTGCTGGGATTACAGGCGTGAGCCACTGTGCCTGGCCTCAGATCATTATTTTCTGTTA 
GCTTTAAACTGTCCGTTCAGGAGATCCCACTGCATCCTCAAATTCAAAATATCTAACACT 
GAGCTTATGATTTAGCrGGTTCTGTCATTAGATGGGAATATCCTTTTATTTCCTTGAAAT 
TATATGGTGAGAACAGGGAGAAGTGCTGATGGTAAAGTCCTGTGATTAAGATAGCAATAA 
GGACTCCGCCCTTCCCACTCCACTGAAGGTTGAAGAGCCATGGACAATGAGAAGTCACAG 
TAGGTGAAATCAGGTACTAAAATGGACTTGGCTTGAGAGATCAAAATTGATCACTTGGTG 
ATACAACTAACAAATTCATGTTAACTTGAACCTTTATTACCCTGTGAAGCATGGTGATTA 
AAAAAAAACAACAAACAAACAGGAAACTTGATTGTTAAATTCTCTTTAAGTCAGAATATG 
TACCTTAGAGTTTTTATTTATGCTTTTGTCTACCATTAATATGTCTGCACCTGCTCTTTA 
GAAGTTAATAGAGAGTAAAGTCGTCTTTATGTCTTTCAGTGCTTACTTATATTTGGGAAG 
TTGAGAAAAATTTTTAACATCATTATTGATATATATATATATATATATATATATATATAT 
ATATATATATATATATATATATAGATAATTTTTTTTTTTTTCTTGAGACGGAGTCTCACT 
CTGTCGCCCAGGCCGGAGTGTGGTGGCGATCTCCACTCAATGCAAGCTCTGCCTCCCAGG 
TTCAAGCGATTCTCTTGCCTCAGCCTCCCGAGTAGCTAGGATACAGGCTCCCACCACCAC 
GCCTGGCTAATTTTTGTAGTTTTAGTAGAGACGAGGTTTCACCATATTGGCCACGCTGGT 
CTCAAACTCCTGACCTTGTGATCCGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGG 
CGTGAGCCACTGCGCCCGGCTGAGGTAAAATTTAAAGTGTACAATTCAGTCATTTTTAGT 
ATATTTATACTAGTTGTACAGCCATCACCACAATCTAAGTTTAGAACATTTTCATTAGGG 
GGTGGGAGAAATTTTACTCTGCTTTTTAGATTAAGTTTCTGTCTGGATCTAATCATTTAA 
TCAGACAATCAGGCAGATTGTCTGTGATTAGTTTTGGCCATTCCAGCTTCTTCATTGGTT 
GTTAACTTTCACAAATAAAGGCTGCTCAAAGATTAGAAATAACATTTAATTTGAATGTAA 
ATGTGCCATAGTTTAAAAGATGGGTTTGGTGAATACAGTCAAATACATACATTTAAAGCT 
CTAATTCTGAAGATTATGTAAAGAAAAGGAAAGAAATGTAGGGAGAGGATTGAAATGTTC 
ATOTTATAACAATATCTGAACATCCATCTGGTCACACCGTTGGTATTTGAATGTTTTGTC 
CTCCTCAAATTCATATGTCGAAATCCCAACTCCCAAGGTGATCGTATTAGGAGGTGTGGT 
CTTTGGGAAGTGATTAGGTCATGAAGGTGAAGCCTTCATGAATGGGATTCGTGCTCTTAT 
AAAAGAGAACTGTGAGAAATAAGTTTCTGTCGTTTGTTAGCCACCCAGTTTAGGATATTT 
TGATATAGCAGCCTGCATGGACTGAGACAACTATGAGTTATTATGATAGCTTCTGTTATT 
TCACCTAAATTCATAGAAGCTAATATATCAATATTTATGCTATGAAATATTTCTTAACCA 
Aft rTTTfl AAT AT ATTT AT ATTTTTGTTTATTT^^ 

GAAGAGACTAAATATAGAAATGCATGCCGTAGTCAGGATAACTCCAGTGGAAGTTACCCC 
TAAAATTCCAAGATCTCTAAAGTTACAACCTAGAGAGAATTTAGTGAGTTCAAATATATA 
TOTTACATCAAAATTCTITTACACGTTTTGTAAGATT^ 
AAGAATGTTGTATTC L " ri " lTr GATACA 

ATAAAATATGCCATGTTCGCCATTTTTAAGTGTATAATTCAAAGGCATT 
TAATATTGTACAACCATCACCACTATCTATATCC^ 

AACTTXMTACCCATTAAACAATAATTCCCCGTCCACTCCTTTCCCCAGTCCCTGGTAATC 
TCTAATCTATATTGTGTCTCTATCAATTTACTTA 

AGTATGCATTTCTCTTATGTATCTGACTTATTTCATTTAACATAATGTTra 

TCTGTGTTGTATGTATCAGAATGTTATTCCTTTTCATGGCTGAATACTATTCCATTGACT 

GCATATACCACATTTGTTTATCCATTCATCTGT^ 
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TTTTGGCTGCTGTGAATAATGCTACAGTGAACATTGGTGTACAAGTATCTGTTTGAGTTC 

CTCTTTTCAGCTCCTTTGGGATATACCTAGGAATTATGTTTAACTTTTTGAGAAGCTGAG 

AAATCTTTAATAAATGATAACACAAATACTTATATTTGCCAATGCAAATATGAATATTTT 

TGGCTTTTAAGAGATTGATCATTTTGCCACGTGGTTGTAATTAAAAAAAATTGTCCCATG 

TTGTTTCAGTATTAATATTGTAGCCTAAAAGAGTGCTAGACTGTTTTACTTTTTACTCAG 

TTAATTCTTTGGATACTGGTAGAGTCAGGAAATGAGATATTGAACTTAAAGATCTTTGCA 

GGTGGGGTCCAG TGGCTCACACCTGTAATC CTAGC ACTTTGGGAAG CTG AGGTGGG AGGA 

TTGCTTGAGGCCAAGAGTTTGAGAATAGCCTGGGCAACATAGCAAGACCCCATCTCTACA 

AAAAAATTAAAAAAAAAATTAAGCCAGGCG TGGTAGCTCACGCCTGTTATC CCAAC ACTT 

CGGGAGGCTG AG ATGGGTGG ATCAC T TG AGGT C AGG AGTTGG AG AC C AG C C TGG C C AACA 

TGGTGAAACCCCATCTCTACTAAAAATACCAAAATTATCGGGGCGTGGTGCTAATCCTGT 

AATCTCAGCTACTCAGGAGGCTGAGGCAGGAGAACCACTTGAACTGAGGAGGTGGAAGTT 

GCAGTGAGCCTAGATCTCACCACTGCACTCCAGCCTGGGTAACAGAGCGAGACTCTATTT 

CAAAAAAAGTAAAAATAAAAATTAGAC ACATGTGGTGGCACATGCCTGTAGTC CTAGCTA 

CTCAGGAGGCTGACTGAAGTGGGAGGATCTCTTGAGCCCAGGAGTTCCACACTGCAGTGA 

GCTATGATTGTGCCACTGCACTCCAGCCTAGGCAATATCTCAAAAAAAATTTTTTTAAAT 

AGATTATTAGGCCAGACGTGGTGGCTCATGCCAGTAATCCCAGCACTTTGGAAGGCCAAG 

GCAGGCGGATCACCTGAGGCCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCC 

ATGTCTACCAAAAATACAAAAATTAGCTGCAATGTCTATAATCCCAGCTACTTGGGAGCC 

TGAGGCAAGCGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTGGAGACTGCGCC 

ACTGCACTCCAGCCTGGGCGATACAGCGAGATTCTGTCTCAAAGAAAAAGGAATTTGTTT 

TCCTGTCTTTATCGTAGAGGGAGGAAAGGGAGAATGGGGTTGGAATGGTTATTGAGTGAG 

CCACATTATGGTAGATGTATCACTGGGCATAGAGAAAAGGAGCATTTAAAACTTTTCCGC 

CTAACAGATGTTTCTTCAGGCTACACTGCACTCATTGTGCTAACTGTAATGTCAAATCCC 

AGACCTGTGCCTATAGAACATGAACATCCTTCATTGGATTTGTTTGGTCAGGCTTACACT 

TTATTAGGAAGATCAGATGTTAAAATAAGGGTGTTAAAGTTAAGTTCAGATATGAGGATA 

ATTCATT AC T ATT C CTTTTTC TGG C AG C CT AAAG AC AT AAG TG AAG AAG A C AT AAAAAC T 

GTA'rrri' ATTCATGGCTACAG CAGTCTACTAC CACC ATG CTTC CTTTG GTAATATC AGAG 

GAAGAATTTATTAAGCTGGAAACTAAAGATG GTGAGTACATTTGTTATTTTGACTTTTTT 

TTCTATTTAAATAGTTGTACATTTTTAATTGTTCTTGCAACCTGTCATACCTGTGAACA 

TATGTGAATAGTGAAATATAATTATGATAATTAAACAGTAGTTTTTATGTATTGAAAAAT 

ATCTTTGGCCGGGTGCAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCA 

GGCGGATCACTTGAGGCCAGGAGTTCGAGAGCAGCCTGCCAACATGGCGCAACCCTATCT 

ATACAAAAAAATACAAAAATTAGCCTGACATAGTGGTGTATGCCTGTAGTCCCAGCTACT 

TGGGAGGCTGAGGCAGAAGGATCACTTGAGCCCAGGAGGTCTGTGTTCCTGCCACTGCAC 

TCCAGCCTGGGCAGCAGAGTGAGACCCTGTTGGGGGGAAAAAAAAAAAAGTCTTTAACTT 

AAATAAATTTGACATTTAAAATCTTAAATTATTTCATCTCTGTTTCAGTACTAACTCTGC 

ATTTATTACTTTCTTTTTAATAGGACTGA^ 

GGAAAAAGAAAAAGATAAAAATATTTTTCTGTTGAGTCCCAATTTGCTGCAGAAGACTAC 
AATACAA GTAATAGCATGTTATTGAATATTTAATAAAATACTATTTGTTAGATATGATTG 
ATAATAAAGTATGAAGTTCCTTGTAACACCTTGCATTGTGAAGTGTATTAAAAACCTGCT 
AAGAGTAAGGAATAACTTGATTTAAAATATTTTATTCTGTAAT^ 

ACAAATTATTGACTTAACCTAAATTTAAAAATGAATGCCTTAGCACAATTAAGTTCCAAG 

AATAGAGTTGATCATGTTAACTGGTAAATGGATCATGATTTAAAATTCTTCTAGGATTGA 

AACAAATGAAAACGTAGTTTTAAGGGTTTGATTTrTTAAATTCCTATTTTTAC^ 

TTTACTGCACAACCCATCTTATTTTGACAGTTCTTAAATTCGCAACTCTTCAGAAATATT 

ATCAGATCACTTTTCTTTGCTTCCATAAGTTTTTTTATTATTATATTATTATTTTTTTCT 

TTTAAAAGACGGTGTCTCACTTTGTCGCCCAGGCTGGAGTGCAGTGGCATGATCATGGCT 

CACTGCAGCCTCGACCTCCCAGGCTCAGGTGATTCTCCCACCTCAGCCTCCCAAGTAGCT 

GGGACCACAGGCGAATGCCATGATGCCTGGCTAATTTTTGTATGTTTTGTAGAGATAGGG 

TTTCACCATGTTGCCCAGAATTGTCTTGAACTCCTGGGTTCAAGCAGTTGTTCTGCCTTG 

CCCACCCAAAGTTGTGGGATTACAAGTGTGAGCCACTGCGCCCAGCTATTCTAGAAGTAT 
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CTGATGTCTCTTGTTGCAGGACTTAGGAATGGAGCTCTTTTACTCACAGGAGGAAAGGTA 
AGTGG TTAAGGTGTGTTGkTUTTTCTGTAACATTTAATAAC^ 

GGGTTTTGACCATCTATTATATAGGGTGGGTTTTGACCATCTATTATATAGGGTTTATAC 
GACATATGGAAAGCATTCATTTATTCACTAATATTTCTGTGTGTCTGCTTTTAGGTGTTG 
GGGGAGTGATGACGAATAAGACTGATGTTCTCCATGCCCTTTTTCTGTGTCAGTTGATAC 
AATTATATGG'l"ri"i"l'L"rri"l'X"lAGGCTATTAGGTGTTGATAGGGTTGAGTAACTTACAAA 
TGTTGAACCAGCCTTGCATACCTGTGATAAATACCACGTAGTTC 

CTACATTGCTGAGITTT ATCTG CTAATG TTCTGTTG AGC'ITT.L'GTC CATTT AAGTTTGAA 

AGTGATTAGTTTGCAGTTTTCTGTTTTTGTGTTGTCTTTGTCTGGTTTTC 

AAATCTGGCCTCATAAAATGAGATGGGAAGTATTCTCTCCTCTTCTTTTGTTTTTTTGGA 

AGAGGTTGTATAAAATTGAGGCTGAATCTTGGTGGTTGCCACAATGACAGGAACTATTTC 

TfiTGAOTGAATATATTGGGAATTCCTATAAAGCAATTATTTTCTA GGG 

AACTTTAGCCAAAGCAATCTGTAAAGAAGCATTTGACAAACTGGATGCCCATGTGGAGAG 

AGTTGACTGTAAAGCTTTACGAGG TATGAGTATGGTAACACTCTATATAAATCCCTTTTT 

CATTAGAAAGACAGGAATGTTATACATAATGCTGTCAATCTAATAAATACACATATCATC 

TAGTCTTTAACTTTTCTGTTTATCATTTAGTCATTAAAATTTCTTTGGCTTTCTAATG^ 

TTTGATAAAATTTCTAAAACTCTCCATATTTAATGGAGGCCTATTTTTTTTTCTAGCCAG 

AACTTTTTGTAGACTACATTTCTGGAAGTGCTCACT 

TTAGAATATACTCTAATTGGTATAAATGATCTCTGAATTGCTATGGAAAACTGGGAGAAT 
GG TT GCTT CAGGGGAG AGAAAG T AGG AG G CTG TGG A CAGCAATGAG GAGAATT ACAG TT C 
ACCATATAACACTTTTGTACTTTTAAAGTCCTTAACATTTACATTATTATCTATTCAATT 
AAAAAATATTGGGAAGATTTTACTTTGAACAGTTAATTTTT 
CATATAGTTCCAACTAATCATGAACTTGTGTATTTCCTC 

GTAACTCACCAGGAAGTTTGAAGCCAAATTTGTGTTTCAAATATAGCAACTCCAGGATCT 
CTAGGCAGATGCATTTGCATTTGATTTTAAATGAATCTTGATCCCTTACTCTCACTTATG 
TTTTCCCACATCCTACTTTTTTTATTTTGTTGTAAGCCATCTAAAATTCTCAATGGGATG 
AAACTGGGTATAAATGAATACATGCATACAGGAATTATAGTAGCATATTCCTTTTCTTTT 
TTCTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTCTGTAGCCCAGGCTGGAGTGCAGTGG 
TGCGATCTCGGCTCACTATAGCCTCCACCTCCCAGGTTCAAGCAATTCTCGTGCCTCAAC 
CTCCCGAGTAATTGGGACTACAGGTGCATGCCACCACACCTGGCTAATTTTTGTATTTTT 
TAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGATCTCAAACTCCTGACCTCAAAGT 
GATCItSCCTGCCTTGGTTTCCCAAAGTGCTGGGATTACTAGCATAAGCCACTGCACCTGG 
CCTCCTTTTCTGAGTTTTATAAAATTTGATACTTTACTGCACGCTTTGAGACTGTATTAA 
TTGAACCATGTTGATGAACAAGTTTTTGTGATGGGTATATTAATAAAATATAGATCAAAT 
TTTTATAGTTAAATCAATATCGAGCTTTTCTAGTGCTTTCAAAAGGACAACCTGAATTTT 
CCCAG<^CTGAAATGATACTGAAACCATTTCATATCTTCTGTATTAAG GAAAAAGGCTTG 
AAAACATACAAAAAACCCTAGAGGTGGCTTTCTCAGAGGCAGTGTGGATGCAGCCATCTG 
TTGTCCTGCTGGATGACCTTGACCTCATTGCTGGACTGCCTGCTGTCCCGGAACATGAGC 
ACAGTC CTG ATG CGGTG C AGAGCCAGCGGCTTGCTC ATGG TAAATGCATCC ACCACTGGC 
TTAAGGTCTTGTTCTTTTGTCAGTCAGCATTTTTAGTCTTAACAATAAATCTACTCTC^ 
CAGAGAATAATATATGTGTTATGTTAAGTGTTGTGTTTGAGGCCCCTGATGGCATTCTAC 
AGTTGTCCTATAGACTGTAATAGCAAAATTGGTAGAGTAAAAACAGTGTGAAAATTCTGC 
AACTTCATGGTTAGTCCTTTAGGGTTTTTCATTCTCCCTTACTTATTGTTTAATTTACAG 
ATTTACTCTTTTGTTCATTTGACAAATATTTGTCAAATGCTTGTGCACAGTCTGTATTCT 
CAAATTCTAGGAGAAAAAGAAGGGTGAACAGTATTAGCGCAGAACGATACTAATAATGAT 
GGCTACTGTGTATGAGTAGCCAGCCCTTTCTTGGCTTTCTTGGATTGCTTTGTATTCTAC 
ATGAAGATATTCCCTGGGCTTTACAGGTCAATAAATGGAAATTCAGAGAGATTAATTTGA 
CCAGGGTGACCAACAAGGAGATGACAGCATACACTATGCGAGAAGTATACACAGAGTAGT 
GTAGGAGCATATAACCTAAACTGGGGGTGAGGTGGGATAAGGAGTTATCAGGGAAGGCTT 
TTTGGAGGAGTTGACAACTGAGCCGAGTTTTGATGGAAGAGTAGAAATTAGCATGAACCA 
ATTTCATGCTAATAAAGAAGCAAAGGAAGCGTGGTCTACAGGCAAAAGCACAGAGGTACA 
GGAAGTAATGATATGTTGGGGAATACCCTGTTGACTGGAGCTTAGAGTGCAAGGAGAGGA 
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GTGCTAGGGAGGTGAGGTTGGAGGGTTTGGCAGCATTGACTTGCTTCAAGGTTCTTAAGA 

GCTGAAATAGATATAAAATGCAACTAAGAGTGGCTTGGATTATTATTACCTAGTGTGTTA 

ATCTCAAATTTTGAAATCTATAGCATCTATAGGACTGGTGTTACTAATCTTACACTCGAT 

CTGTTACTGTTCTTATACTAGATCTATTAGTCCAGTGTTTAAGGGAGTGGTGCAGATTTC 

TAGGTCAGGACAGGACTCAGATGTACATTATTAATGCCTATTTCAGTTCTGACCTTCTCA 

TATGAAAC CTTATAAGACCTGGGGT AGG AAG AGATTGTTCTGGAAG TCATAGGAATATG A 

AC TG T ATTTTGTTT AAC AAACAAT ACAG TATGG AAATTT AT CAC C CTTCCAG AAT ATTT A 

TTTCAGAGACAAATTTTTATCATTCGTTCATTTATTTCATAAGATCCACGAGTAGGG 

CTCACTAGACATTGCTCTGAGTATATGGTCTGAGTTTGCAGTACCTCTTGTGTCTCCATT 

AGATTTATTAGGTCCTCAATAGATAAATCAGGGAATAACTAGATGGATTCATTTTTTAAA 

GACATGAAAGAGCGATACCATACATACTGCACCTTAAAGGTCAACCTTAGAGTATCATTA 

TTTTTAATGAATGTATAATl-ri'TAAATTTC^TGTTTACITri'CCTAAG 

ATTGCTTAATTCCAG CTTTGAATGATATGATAAAAGAGTTTATCTCCATGGGAAGTTTGG 

TTGCACTGATTGCCACAAGTCAGTCTCAGCAATCTCTACATCCTTTACTTGTTTCTGCTC 

AAGGAGTTCACATATTTCAGTGCGTCCAACACATTCAGCCTCCTAATCAG GTAATACACT 

ACTTGTAAGGATTATTGAATTATGTCCCTTTTATAGAAATTATTTTTCAATTTTATTAGT 

AATTCGTGG CTTT AAATTT AT G C TTC T CTT AATG AT TTT AAGG AT ATGT AAG T C AACATT 

TGGTGCATATTG TG CT AGAGG C AT AAATT AT AATTT AT AG C CAC CT GAAATG TT AG T ATG 

CGCTTTCCAAGAAAATGACTTTTTTGAAAATGGTATTTCTTTGAATGAGAAAGAACAGAG 

AGAAATAGATAGATGGCTTTTAAACACTTCATTAATTAAACTTTTTTTTTCCACCATCAC 

ATAATGG CACTT AG TCCCCTTTGGGAACTC ATGAGGG TTTT AGTGG TAGTGAGCTG AAAG 

AAATATGTTCCAGGACTGGCAAACATATTCTAAATTCTTTAAAATTTTCACCTAGCATCT 

ACCCTAAATATTCAGACCCTGTGCTAGTTAACTGCTATTGAAGAACAAAGGTATTATATC 

TATTATTAAGGATAATAGAATGGTATTTGAGATATTGGTWTTGAATATGAATATGTTTT 

GAGAAATAAGTTTTATAGGAACCAAAAAAAAATTCTTAAAGGAACCATATATTACTAAAA 

AT GCTT CTT ATTGGAGAAAG AAATGACAAT C AT TT ATT AATGTG AT TTTTT CAC AAC TTT 

ATTAAGATATAATTTAAGTACAACAAACTCACATAAAGTGTACAATTTGATCAGTTTTAA 

CAT ATGTAG ATGC CATGAAACCATCACCACAATT AAGGAAACAAACATTTTCATC ACTC C 

AGAAGTCTCCTAGCCCTTTTACTACCCATTCCTCCCCTGCTCCATCCCCAGACAACTACC 

AATTTGCTTTCTGTCACTATAGATTTGTCAACCTGATTTTCTCCAAATATACATTCAAAA 

ATATACAGTTGAATACAATTGGAAATTCGAATTTTGTGTTTTTTTCTTTAG GAACAAAGA 

TGTGAAATTCTGTGTAATGTAATAAAAAATAAATTGGACTGTGATATAAACAAGTTCACC 

GATCTTGACCTGCAGCATGTAGCTAAAGAAACTGGCGGGTTTGTGGCTAGAGATTTTACA 

GTACTTGTGGATCGAGCCATACATTCTCGACTCTCTCGTCAGAGTATATCCACCAGAGAA 

AGTATGTTTTACTATTAAAACCTGAACTTGGAATCTTCTTTCTATTGTGGAGAAATGTAA 

TTGTAGTAAGACAAGAATTAAATATATTCCATTGTAGTATTTGAATAAGCAGTTATTTGA 

GTAGAAAATTAGTGTTTCCAGCTAAGATGATGGCATATTTTGAAAATTCATATAGTGAAT 

ATAACTAGTAAAAGAAGTTTTGTTTATTTTTAAACAG AATTAGTTTTAACAACATTGGAC 

TTCCAAAAGGCTCTCCGCGGATTTCTTCCTGCGTCTTTGCGAAGTGTCAACCTGCATAAA 

CCTAGAGAC CTGGGTTGGG AC AAGATTGGTG GGTTAC ATG AAGTTAGG C AGATACTC ATG 

GATACTATCCAGTTACCTGCCAAG GTATGTTTAAAAAAAGAAAAAGTGAATACTTACTCC 

CAGAAGAAC C ACTGTATTATTGG CTTTGGCT TTATGTGTCAG CTTGCC C AATCTCCGTGT 

GAGTCAACAAGTGTTTACTGAGTT AC CAAATAAATGTCTTAAC ACTATTTT AG GTACTTT 

AACAAATTTT AATTTT ATT AATT AATTTTTT ATT AG AATTG AG AC C T C ACT CT GT CAT C T 

AGGCTGGAGTACACTCACAGCTCACTGCAACCTCAAACTCCTGGGCTCAAGCAATCCTCC 

TGCCTCAGCCTCCCCAGTAGCTAGAACTACAGGCATGAACCACCATGCCCGGCCAACTCT 

TTAATTTTCTTAG AGACGGAG TCTTGCT ATG TTGC C CAGGCAGACAG ATTTTAATGTGTA 

TGATGCAGTCTTTGATGATAAGAAACTTATAATGGAAAGCTGAGGTGATAGTTACAGTAA 

AT ACATTTTG AT GTAT AATT C TG TTTG CTTT AATCATT CAAATTGT AGT AAAG CAAG ATG 

AACTGTCTGCTGGGATTTGAGCAGAAATGGATAGGAATAAACTAGGAGGTAGAAGAGTTA 

TCAAGGTTCACAGG ACTGATGGGTGAAGCTAG ATTTCCAGACCCGGGATGTCAGTC CTTG 

AAAAGCAGACTTGGCAGGCATAGACGAGGCAGATAGCAGGATAAAGGAGACAAATGTAGA 
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TTGTTCTTCAGAAGATCAGATGGTAGAGTCTAGGAGGTAGTGTGTTTTAATCAGAGATCT 

GAGAGGCAAAG ATCATTG CATG AGATCAGGG ACC CATG CAAAGG AG TGAGAAAAAAAACT 

GGGTTAAGGAGCCTGCTGCATGGCAACTCCTGGGAACAGTGGCCACTGGGGCCTGGGACA 

TGTTGATTGCAGCCCAGGACTGTTAAAACCAGTGTGAGAGAACATGGGTATGGAAGTACT 

AG CT AG C AGG AT CATGACCCCGATG CTGGGATGGG GCATCAAGCATT AGTACATGG AGAT 

TCAGTACATCCAGATGCAGTACATGGAGACTATATGCGTAACTGCTGACTTTGGGCTTCT 

TTCAGATTGGAGCAGAGGTAGAGGTGAGTGGGAATATTCTCAATAGAGGGAACTAAATAG 

GCATACCTAATAAAGGAGACCAGGATATTGCAGACAGTAGCCTCATGTTTGGCTCACCTG 

TT CAAAAAG TTC T CTTG TT CTTGAG CAG TG G TGC CTT AAAAGG T AAC TTG AG AAG C AG T C 

GATTATTTGTTCAGCCTGGAGACTCTTGGGATATTTTACTATCTTTGATTGAATAGATCT 

AAATGTACACAGCTCTCATAACTTGCCCCATGAAGCATATCCATGAAAGGCACTATACTT 

G TT AAAAG ATTGG TTTG TACT TTTTAAATG TAG T AC TTTT AAT AAAAC AGG AAAAAT AG A 

AGTTCTG ATGCAG TTAT ATG C ATTTT ATATAGAATGTGTTCTT AATTGGAAAAAATTTGT 

CGTAGTTCCTTTGAGTTCATTTACAGTTTTTAGTAGGAATTGTATTTTCTACTGTTGTAC 

TTGCTGTTACTAAAGAAAGATGGTCGTGATTACCATCTGAATTTTTTTTCTATACATTGA 

TCTTTAG CTGCT ACTTAGT CATTTCTGTTTAGACTTG AGCTCTTTTTCATATT 1 l"l"l M rri"i' 

TTTGTTTCTC AG TATC C AG AATT ATTTG C AAACTTG CC CATACG AC AAAG AAC AGG AAT A 

CTGTTGTATGGTCCGCCTGGAACAGGAAAAACCTTACTAGCTGGGGTAATTGCACGAGAG 

AGTAGAATGAATTTTATAAGTGTCAAG GTATGTTGTCTACTTATCin'CTITriTl'ATTTA 

GGTAAAATTAACATAAATG CAGTT AG CCATTTC AAAGTGTAAATTCACTGG CATTT AGTG 

CATTCACAATGCTATGCAACCACCACCTCTCTCTAATTTCAAAACn'TTTTCATTCCACTC 

CTCCTCTTGCTTATCCCCTGGCAACCATTCATCTGCTTTTTGTCTCTATGGATTTGCCTT 

TTCTGT ATATTT CATATAAAACAAAT CATGC AATATGTGAC CTTTTTTGTCTGGCTTCTT 

TCACTTATGT AATGTTTT C ATGGTTC ATCCAGG TAGTAGCATGTATCAGTACTTC ATTCC 

TTTGCATGACTGAATAATGTT ACCATACTTTG T TTATCCACTTATCAGTGGTGAAC ATTT 

G AATTGTTTCTAC CTTTTG ACTATTATGAAT AATGT TGCTGTAAATATTCATGCAC AAAT 

TTCTCCACGGATATGTTTTCATTTCTCTTGGGTATAAACTGAGGAGTAGAATTCTTGGGT 

C TTAGGG TAATTCTCTAACTTTTC AAAGAAC CACCAAACTGT CTTTCACACC AACTG CAC 

CATTCCCACTAGCAGTGTGGGGGGTTCCTGATTCTCCACATCTTTACCAACACCATTATG 

TTTCTCAATTGTGGGCTAGTCTCACATTTGGAAAGCTAGTGGGAGCAGCGATCCATCTAT 

TAAAAGTTGTATGAAATTGAGTAATGAGCCACCTCTCTCTTGTAGGGCTTATTATGTTCT 

TGCTTAAGGCAATCTTCATGCATTGTGAACAGAATTATACATAAATGCTCAGATAAAAGG 

GCAAAC C ATTCTTAAAGGGAG TAG AC AACTAG AGGC AGGAG ACCATACTG AGGC AGGAAG 

CTGGGGTTTTTATGGTTCTGTTACITTTGACTATATCTCACCATTGCTTTTGTCAAA 

AGACTAGGTCT AAGTTTTTTTCAGGT ATAAGGTG AGTGTGG TAATT AAGGGG CATG CTAG 

CAG AT CAT TTTGGGT AAT G CTT C ACAG T C CAC C AC T GGTG TGT C ATTG T GG T C G CAG ATC 

CAGTATCTTAGCTGTGTAATTTCAGACATCAGCAATATTAGTTTAACAAAGGGCAATTAG 

ATTCC^GACAAAGGAATCGTGTATTATTCTAGCCTTATTCAAACTTGATTTATAAATCA 

GTTTAGTAATTTATTTATTTGTTTCTGTATTTATTTTTATTTCTTTGAGATGGAGTCTCA 

CTCTATTGGCCAGGCTGGAGTGTAGTGATGCAATCTTGGCTTACTGCAACCTCTGCCTCC 

TGGGTTCAAGCTATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCTAATTTT 

TGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTGAC 

CTCGAGTGATCTGCCCGCCTTGGCCTCCCAAAGTTCTGGGATTACAGACGTGAGCTACCG 

TGCCCAGCTCAGTTTAGTAATGTATAACTGGGTTTTACCCAGTTGTAAATTACTCTTTTG 

TCGTGTTTTTTTGAGAACTGGCAATGACGGAGAAACTAAAAGTGCCAGGCTGTTGCCTTG 

TTCCTGTTATTTTCCCTTAGTTTTTTTTTTTTlTTITrrTTTCTCTGAGACTGAGTCTTG 

TTGTGTT ACC AGG CTAGAGTGGAGTGG CATG ATCTCGGCTCACTGC AAC CTCTGCCTCCT 

GGGTTCAAGTGATTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCGCCTGCCACC 

GCACCCGGTGAATTTTTGTAT TTTT AGTAGAGACGG GATTTTACCATGTTGG CCAGG CTG 

GCCTCGACCTCCTGACCTCATGATCCACCAGCTTCGGCCTCCCAAAGTGCTGGGATTACA 

GGCGAGAACCACCGTGCCCGGTCTTGCCTTAGTTATTTCTTGTTCCCTCCTCTAGTCCTA 

TAGTTCTCTGACTGTATTGAGGAAATGTAATTAAATATTATTATGTTAATAGATATTTAT 
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GTGGTTGAATATTAGAAATTCCTTATTTTGGTCACATATCCTGATCAGTAGTTGGTCTTC 
TGGAGATAGTGATTTTTCACTAGAGATGACTTTAGGACCTATTCAGGTTTTTTTTAAGAT 
CCCAATTTAAGGAAAGACTATTCTCATTATTGATTTTGCTATATGCAGGGAAATTTATTT 
CGAAAGGTTTTTCAGTTGGCTTTTAGGGAAGATTATATATTCTCTTTTTTTTlTl , 'r , lGGC 
CTTTTCCCACATGTTCTAAAAATGATATATTCTTTAACTCCTATGAAAATACATTGTTTC 
AGTAATTGAAGATGCTGATTAAAGTCATATCTCTACACATTTTTTAAAATTTGAGATAGA 
TGGGACTTTGTCCCTTCTTACACCATTCACTTATTCACTTGGAAAAACTATTATCCAATA 
CTTATGTGGCAGACACTGTTTCTGGCACAAGGGATTCAGCAGTGAACAAAACTGCCTT^ 
TGGAGTT T ACAT T CT AC T AG TGGAAAG C GACAACAAG CAGAT AG AC ACATT CAG T ATAT A 
ATTCACTGTCAGATGGTGGTGGTAAGTCCTATGTAGGAAGAAAAGCAGGGTAAGGAGGCT 
TCGAGTAACTGGAGTGAGTCATAGATGGACTTGTCAGGAAAGGGTTTCTGAAGAGGTGGT 
AT TTGGG C AG AG AT C T AAAT AAAATG AAGCAACAAG C CATGAG AAT AT C CGGGGGAAAAT 
GTTCTGGG CAG AAG CAT C AAG CAT AG AA CTTG TGGT ATG AT ATTT ATT CT AG C AC AC ATT 
AA'iTlT AAAAATG TAT AAAAG ACAT C CATTT AAT CAT ATT AAAGATTTC CATG ATT C ATT 
TAGACTTAGTCAGAAACCAAATTTATATTTTCTTTTTAAATAATTTTATCTCAACTCTTA 
TTTTACCCAATAG GGGCCAGAGTTACTCAGCAAATACATTGGAGCAAGTGAACAAGCTGT 
TCGGGATATTTTTATTAG GTTGGTAGCCTATGAATGTTTTTAAAGTAACTGACTCTGTTA 
TTATTTATC AAT CAGTG CTTTTTTTGGT CTTGTTTTTTGAAGAACTGATATTTGAAACCT 
GTGGTTTATGTGAATTATTAATAAGCTAGAGGACGTGGATTCTCTATTTCATCAAATAAT 
ACAAAACATTTTAGATATTAAATTTTGGAAATTATTTGGTTTTGTTTTACAATAGAAATA 
CTCCTCAAAGTGGAATCGAAGTGGTTATTCAAAGAAATCTCAGAGTAGATTCTTATATGA 
AGCAAATAATTGCCCCTAATTTATCTCTAAATTTTGTAAGTTCTAAATTCTTTTTTCCCC 
CAGTTTCTAATTTATCTCTTATAAGTCAAGAGTCCATCTGGCCAATTTAATTTCAGTGAG 
TGTAACTATTTTGCATATATTAAAAAACTGTATATGAATACAGAAGATGGTATTTAAGGA 
TGAAAATAATTATTCAAATGTGATAGCATTATGGGGAGTTTTAAAATAAAAGTTACTGTT 
TTATTCTTCCAAAAATTTTATTATAAAGTATACAGTTAAGAGAATATACATAAAATACAT 
ATG CAGCTTAAGGAAGAAT AAT AAAATG AATACTTCATGTATTC AC CAC CG AGTTT ACC A 
GGAAAAAGCATAAACAAAATAAACCTCTTCCACGTAATTCCTGGGTTAAAGAGAAGTTAT 
AGTGGAAAATATTTGGGAG CAAACG ATAATG AAAATACTAT C CATT AAAATTGTT AGATG 
TTGCAAAACTGATTTCAAGGAAAATTTATAGTGTTAAATGTTTAGAAAAGAAAAAAGGTT 
AGAAGTTAACCACTTATGTATCTATCTCATGAAATTAGGAAAATTATAGATATAAACTAA 
AAAAT AT G TT AAAAGGG AAAT AAT AAAG AT AAG AAT G AAG T TT AAT G AAAC AC AAAAC AG 
AGAAGCTCACAAAGCCAAGATTTATTTTTTGAACACCGAGTACAATTGACAAATCTCTAA 
CAAGTTTGATTAAGAAAAAAGAAAGCATGAATAAACAATTTTAGGGATAAAAAGGGAAAC 
ATCGCTAAAGATATCCCAGAAATGTAAAAGATAATAAGGGAATATTATGAAAATATTCAT 
GCCAATACATTTGAAAACTTAGGTGACATAGACAAAAACAAAATTGACCAAAATTGAGCA 
AAAAAGAAACAAAATCTGAGTAGTC CTGT AACTTAGTAAAAATTGAGTT AG AAAAG TTAA 
AGAAGTCTTTACACAAATCAAACATCAGAOTCAGTTTTCTAGGAGAGTTTTGCCAAACAT 
TCAAGTAGCAGATAATTCTGGTCTATTTTTGGCCCCAGAAGATATATTTTACTTGCCATG 
CATTTAATGAGATAGCTGTTGATTTTTTTCAATCACCGTGACAGGTGTTTTATATTAGGT 
GTTATTCGCCAGACATCTAGTCCACCTGTTGCCAGATATGGAATTAATATTCACTTATTT 
TGAATTAAAATTTGTTAATAAATTAATAAAACAAAGTCAAAGTTCAAATTATTAAAAAAG 
TAAAAGAAATAAAATATATTTTATAGAGAGCCCTTACAAAACAGTACCAACATAATGAGC 
TTT C CAAATTTTG AATG GG C AAAAT AAATG AAT AGG CATTT CAC AAAAG AAGG AAG GGT G 
GCCAATAAGTATATATTAATATAAAAATGGTTACTTGTAATAGGAATCAAAAGTGTTTGA 
CTTATTGACTAAGAGTCAGTTTTTGTTTTGATCCCTGTTAGTCTATCCAGAAGGCATGGG 
TCTTAATAAACACCTTGACCTCAACAGTTTACTGAATACAAGGGTAATTTCATATGCCTT 
GCCTTCTTTAAGGGTTTGTTGTAAAGATT AAAAT AAAT ACAT AAAT AT AT AT AAAT ACAT 
TTATATGTATTTATATGTAATTACATACAACTTGCCTTCTTTAAGGGTTTGTTGTAAAAA 
TTAAAAGAAGTATATAAATATATATAAATACATAAAATAAATACATTCATATATGTATAT 
GAAATCACTTTGCCAACTATGAAGCCTGATTCAAATATGAAATGTTGTTTGTTTTTCCCA 
GAGCACAGGCTGCAAAGCCCTGCATTCTlTrCTTTGATGAATTTGAATCCATTGCTCCTC 
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GGCGGGGTCATGATAATACAGGAGTTACAGACCGAGTAGTTAACCAGTTGCTGACTCAGT 

TGGATGGAGTAGAAGGCTTACAGGG TAATAATTATAAATACAGAAATAGAATGTTATAAC 

AAAATGTCATCATGTCATCAGATTTTGGTAAAAAAATG l'lL"ri"l"i"rTCCTCTAG GTGTTT 

ATGTATTGGCTGCTACTAGTCGCCCTGACTTGATTGACCCTGCCCTGCTTAGGCCTGGTC 

GACTAG AT AAATGTGTATACTGTCCT CCTCCTG ATCAGG TGACAATTTCATATTTAGAGT 

CCAAAACCCAACAAATGCTACACTCTTTCCTTGTGAGCTTTACTTCTGCCAGGTAATGGC 

AATTGTCCTTAGAAGACCAGCTTTCTTAGGGAAAAGCTTTAGCCACTGTTTGCTCAAAGC 

ATAAAAAGATTCTG AATTAGATGCAAAG CCTTTTTTTGGCC CAGTG CAAGTCTGAAAACT 

TTGTAATCCTTCTGTGTTGGCTGATTGGGGAAAAAAAAATGCAAGAAACCTAATGTATTA 

TATTTTCACATTATCTTCTGTTCAAAGATTACATACTTCCATTATCCTGTCAAAAAA 

ACTCTGATACAGAATCAAGCATGTGAATCGTAAGCATGTAAGCAGGTTTCATAGAGATAA 

TTTTTCAACTCTTCCTTGTCCTGTGTTGTTCCAACTCTTATTCTCCAATTTAGAAGCAAA 

CAAAT AAATG AATG AAAG AACAGAT AG ACAAATGAAT AG TC AAAGG T AT AAAG T AT CTGT 

ATATATGTTACATGTAGCTATTATTTAAATTATTTAGATTTTCCTTTTGAAATACCTTCT 

TGG CACACTTGC CT AAATCT AG AAAATAAG CACTG T GTGAAT AAG AAATT ATTT ACACTG 

AAT ATTTTG T AG G TTTT TG G G TIT '1TG TTTTT CAG ACAAGG T CTCACTTTG TC AC C CAGG 

CTGGAGTACACTGGT ACGATCACAACTCACTGCAGC CTCT ATGGCC CAGGCTC AAGC AAT 

CTCCCCACCTCAGCCTCCCGAGTAGCTGGGACCACAGGCACACGCTACCATGCCCAGATA 

ATTTT ATTATTAATTTTTGTATAGAGATGGGGTCTC C CTGTGTTGCCC AGG CTTTCTTG A 

ACTCCAGGGCTCAAGTGATCCTCCCACCTCAACCTCCCAAAGTGTTGGGATTACAGGCGT 

GAGCCACCATGCCCAGCCTTAAGAGTGTTTGATTTTCATTCATTTTCCTATATATATTAT 

TTCTGTTGGGGAAAAAATTCCAAGGAAGATAAATAGTAGGCTGTTGGTACATTTCTCAAC 

TTACTTATAAAGCTTTTTAGATATATAAGGTTAATTTATGAAGAAAATCATAAGATACAC 

AATTrAAGATAATATTTTTAATTTTATaT M lTTATTTGTTAAATAAATTriT'CTCCTTTCA 

G GTGTCACGTCTTGAAATTTTAAATGTCCTCAGTGACTCTCTACCTCTGGCAGATGATGT 

TG AC CTT CAGCATGTAG CATC AGTAACTGACTCC TTTACTGGAG CTG ATCTG AAAG CTTT 

ACTTTACAATGCCCAATTGGAGGCCTTACATGGAATGCTGCTCTCGAGTGGACTCCAGGC 

^GTTATATGAGGAAGTTGTTATGACATTTTATGAGTGATAAAAGAAGTACAATGTCAAA 

ATTTCCACCTTAAAAAATGCTATTTTTTAAACAACTTTGGTAAAACTGTATAGAAACATA 

AATTTACCTTTAGTTGAATGTTCCATAGTTGGAATATGGGTTTTGCAGAGAATTTATAAT 

TATGAAGTTTG ATGT CTGTTTCTTTAACATT ACCTTAATATTGGCAAAAACATGTTGGTG 

TTTGCAAGGATATTATTTAAATTGGGATACCATGAATTAAATACTACAAACAAAAATAAT 

TAGAGTTTTTTGTTTGTTTGTACTTTAACTTTTAAAAAATAATCAGTTAAAGTTGTTGTT 

TTGAAGCTCACATTGTTCCAATCTGGCCAATAGGAGCCCCTTTTGTATGGCTCCTGTATC 

TTTATGACATGTCCTCATCATTCTTGAATCACTTCCTCACTTCCAGATACAGTAAGTTAT 

TCTTGGCCAGGTGCAGTGGTTCACGCCTGTAATCCCAGCACTTTGGCAGGCCAAGGCAGG 

AGGATCATTTGGGCCTAGTTTGAGACCAAATCATGGTTGCACAAACTGTACCCACTATGG 

ACAACAGAGTGGGATCTTGTCTCTGTGAAAAATTTAAAAATTAGCTGGGCATGGTGGCAC 

ATACCTGTAGTCCTAGCTTCTTGGGAGAGGCTGTGGCAGGAGGATCGCTTGAGTAAATCC 

AGGATGCAGTGAGCCATGCTTGTGCCACTGCACTCCAGCATGGATGACAGAATGAGACCC 

TGCCCCCAAAAAAGAAAAATATTCTTGGTTTATCTTGTACTTTCTGTATCCCAGCCCTAG 

CATCAGCCTTTTCTCTAAAGACAGTATTATGATTTTAATATTTACAGTAGATATTTGAAC 

TGTTACATTATAGACTTTACCATATATTTTCTAGGAAGGATTATTCTATTACTCTTCTTT 

ACCACATTTGTTTGGAATGTCTACAGAACCTACAGTTTCTAAATCAGAAACTCCCTAGGT 

TTTTGCTATTTTGGCAAGCCATTGAAGTTCTTCCCTCTCCCTTTACTACCAGAAAGGTGT 

GTATTTGTAGAGCTCTCTATAATGAGAAAGCACTCTATAACATGGTTGATTCATCATTTT 

GGAGTAGAAAAGTATGAATGGAAAGTCAGAGACATAAAAATAAAGCCCAGAGGTCTGAGT 

CTTAGCTTCATTACAGACTTTCTTGGGGGATGGTTGGTAAATTATCTACACATTCTATCT 

TGTCTTTATAATTTTAATAGTTAAATTTTTACCATGTGCCTCAAAACCGTTAGAGAATTA 

ATGAGCTCTTTGAAAAATGCTTCTAAGTTTCTTGTATTGCTCTAATAGAATGCTATCTAT 

GTT ATT ATTT ATTTCTG AG AC T AAAATTGTTT AC AT CTTT AAACTG G TTGT C C TTTTG TG 

TATTTTAG GATGGAAGTTCCAGCTCTGATAGTGACCTAAGTCTGTCTTCAATGGTCTTTC 

TTAACCATAGCAGTGGCTCTGACGATTCAGCTGGAGATGGAGAATGTGGCTTAGATCAGT 

CCCTTGTTTCTTTAGAGATGTCCGAGATCCTTCCAGATGAATCAAAATTCAATATGTACC 
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GGCTCTACTTTG G AAG CTCTT ATG AATCAGARCTTGGAAATGGAACCTCTTCTG ATTTG 

TATCTTGTGCAGTCATCATTATACAGTTCTGAAATATAAAGCTATATGTTGGTGTAAAGT 

TG CAGTGATTTCTCTCCTAACCAGCCCCACATATTCTTCCTGGTTGGTTGGTTCTTCAGT 

AAAATAGTCTTGTTTCTTGCTTACACTAATTGGTAATTTGCATTCCTTGTTAAGATTTTC 

AAGACAGGGCTGGGAGCAAGGAACCAAAGTAGCGCGTGGTTGTGATTACCTTTGGTTTCT 

TTGAGGTTTCTCTTACCTAGTGGCTTTAAAACATCTTTAGGAGCAGTTCCATTTTATAGT 

AAACTT AAATT CTGTT ATC ATGAACAG TTGAGGAT AATG AAT AATTTGAT A C AAT AATG T 

AAGAAATT C CTG AAAACAAAG TG TT AT CTG TGAT AC TTTTG CTG C AT AGT AAG CAC AATG 

AAGTGTACTG ATAATGTTTCAACAGGAAAG TG TTTTGATTAAATGTGGGCAGTATCACTG 

TTCTACTAGCATTCAACATCTCTTCTAAAAATTAATAGTGGTTCACTGTAATTTTAT^ 

TACATGT AACATCTGTACATGTGTTTGGTT AT CT AT ATGTTTC CTGGTTTTTTGT AC ATT 

TGCTTTATTAATTTAGGLTI"ri'TTTTTrri"l , l M I , l"rri"I l GAGACAGTCTCACTCTATCATC 

CAGACTAGAGTGCAGTGGCACAATTATGGCTCACTGCAGCCTTGACCTCCTGGGCTTAGG 

TGATTCTTCCACCTCAGCCTCCTGAGTAGCTGGGACTACAGGCACATGCCACCATGCCCA 

GCTAATTTTTGTATGTTTTGTAGAGACGAGGTTTCACCATATTGCCCAGGCTGGTCTCAA 

ACTCCTGGGCTCAAGCTATCTGCGTGCCTTGACCTCCCAAAGTGCTAGGATTACAGGTGT 

GAGCCACTATGCCTAGCCTAACTCAGACTTTAAAAATATAAAAGCAATTCATTTTTATTC 

CCAAGAACAGTAAGGTGGTGGTTTAATTTTAGTCTTTAATTCTGTTTTTAATTTATTCTA 

TTTAGAAATGTCCCAGAAACTTAGTATAACTTTACTTTCTGAAAATGAAGAAACCTGTCC 

TTGGGCATTAGTGTGTTGGATTTAAGCAACAAAGTTAAAAAAACCTACCCTGTGTTATGG 

CAATTTTCACTTGATGGTGGTTCTATAACACAGGTATCAGTGAACCTTTATAAAAGATGA 

ACAACITTTCAGCTTGCTTAATTTCAGTTAATTAACAT^ 

TTTATTGCTTAAAATGTTTAATTTTTATATTTGGTAAACAGATAGTTTTTTCTCTCCCCC 
TCTTCCTTCCATCTTTCATTACTACAATTTACCATGCAGAGCTCACAATGTCTCTCTGCA 
CCAAGCTCCATGACTCAGGATTTGCCTGGAGTTCCTGGGAAAGACCAGTTGTTTTCACAG 
CCTCCAGTGTTAAGGACAGCTTCACAAGAGGGTTGCCAAGAACTTACACAAGAACAAAGA 
GATCAACTGAGGGCAGATATCAGTATTATCAAAGGCAGATACCGGAGCCAAAGTGGA GTA 
TGGCTTTTTCCCCCTCATTATAATTGTTAAAACTTCTTAAAAATTGTTTCACCCTTTTGA 
TATATATTTCTTTGACTTATAAACGAGCTATATTTATAAACAAGGGACCAGAACACATTA 
ACT CAGT CATGG TT ATG TG CT T C CTT G CTTT CAATG TTTC ATT AT CTT AT AAGG AAG AG A 
ACGTATGGTCTCTTGAAAAAACTGACAATAAGAAGTAACAACTGGACTACCACATTTTTT 
TTTACATCCTTAATTTAACTCTTCGTCAATTTCri'TrTTTACTTAAG GAGGACGAATCCA 
TGAACC AAC CAGG ACCAATCAAAAC C AGACTGGCTATTAGTC AGTC AC ATT T AATG ACTG 
CACTTGGTCACACAAGACCATCCATTAGTGAAGATGACTGGAAGAATTTTGCTGAGCT GT 
AAGTAAC AG ATTCTGTTTTGG AAGTACAG CTACTATT ACAAG TG AC AT AG T ATT AC ACTT 
AAACCTTTAAAGTTCGTGTTTAAAATAAAAATATTTTGAATATTTAAAAGCTAATTCAAA 
AAATATGTGTCGTAGCTATGCATTAAAAAACCCCAAAATGTCAGAAGTACAGAAGTCAAA 
ATTGAGTTTTCATTAACCAGTTCATTTGATTATATTTGAATTATTCATAATGGACTCATT 
TAATTTTAGTAACTTTGGGCTGGGTGCTGTGGCTCATGCCTGTAATCCCAGCTCTTTGGG 
AGGCCAAGGCAGGTGGATCACCTGAGGTCAGGAGTTCGAGGCAAGCCTAACCAACACGGG 
GAAACCCCATCTCTACTAAAAATACAAAAATTAGCCAGGTGTGGTGGCATGTGCCTGTAG 
TCCCAGCTACTTGGGAGGCTGAGACAGGAGAATTGCTTGAACCCAGGAGGTGGAGGTTGC 
AGTGAGCCGAGATTGCACCACTGCACTCCATCCAGCCTGGGCCACAGAGCGAGACTGTGT 
CTOUIAAAAAAAAAAAAAAAATTTAGTAACTTCGAAGAAATAAGAAGGAAAATTAAAAGT 
TGAAAGTGATTCTAATGTATAGTTTATAAAATTTTGTTATAAAAATACCTGTTTTGCCTT 
CAAAATAATTTATATTAATATTTTATTGACCTCAAGAACATTTAAATACATTCAGATTTA 
TTCATTTGTGGACCACATTTGTTATAt^TTGGATITAAAGGATCCTTGCAATTGAGTTTA 
TGGCCACCTATGCATCTGAGACCCATGGACTGGGAACCATTCTAGGTCAATGATTCAGTG 
TG ATTO^TITAAGAGATGTT TATTCCTGGTCTTT AG AAG CTGCTACCTTTTGTT ATCTA 
ATTTTGCAGTACTTTGAAGTATGTATGTATGTGTACATACGTTAGTGCTATGTATTTATT 
AAAG AAGAAT C AG AAAAC AG AGGTAAGG AAAAAT AAG G AAAC AAAT TT CTG TT AAG C C C A 
CCACCTCCCAAAGCATATTTCTTTATATGCTTATATATGTTTTCCTATTATGGTAAGAAC 
AGTCTGTACATATTGCTATATAGCAGTCCCCCTTTATCCACATACATCCTGAAAATTGTT 
TTACATTTTAAATGTTAACTACTTTATTGTTTTTAAATGTCATTTTATAGTGTAGCTATG 



FIGURE 14.13 



WO 99/67395 PCI7FR99/015I3 

32/64 

CCACAATATCCAATTTTTAGACATTTAAATTGCTCCCAGGCAATGTGG 
TTGCAGCTGAATATATGCACATATCTAATTGTTTCACTAGGATAGAGGTGGAATTGTATA 
" ACAGGGAGCTCACATTTTTTAAGGCTTTTGAAATGTATTGCCAAATTGCCTGCCAGATAT 
ACTGCACCATCACTAACATTGTGTGTTGCAGTATTTTTCTAAACTTGGCCCTT^ 
T AG AAAAATG AT AT CAAT AATTT ACATTTCTTTGATTAAAG TG TAG AAG TT AT AATTTTT 
CATATTATTCATTGTCATTTGTATTTTATCTTTTCTAACTTGTCTCTTCATCCCCTTTGC 
TCCGTTTTCTATTGGAGTGCAACTTTATTTGTAAGAATTCTTTTT AATTT 
AAl"i"I~rrrrri"CTAGTTTGTTATTTCCCGTTCATTTCTTAAAATATAATTGTGTTTGCCA 
ACAATCCATTATCTTTTGTTTTGTAATGGTAGTATTTATACATATTAAATTATCTCTTTC 
TTTTTTCAGATATGAAAGCTTTCAAAATCCAAAGAGGAGAAAAAATCAAAGTGGAACAAT 
GTTTCGACCTGGACAGAAAGTAACTTTAGCATAAAATATACTrCTTTTTGATTTGGTTCT 
GTTAAGTTTTTTGATGGCTTTTCCATATGTTGTAACAGGAAAAAAATGGTGTCTATGAAT 
TTCTTCTTAATTTAACAAATTTGGTTAATTTATAAAATCACAGATTGGTAAATGCTATAA 
TTATGTAATGATCAGGATTGAGATTAATACTGTAGTATAAATTGGGACATTATAACAGAT 
TCCATATTTTATTTCCTAAAATCTAAATTCAGTCTTTAATGAAATAATATTAGCCAAATG 
G TGG AACT AATT T ATTT C1TTTGAGG AAAAG AT AAT AAAGAATG T AATT AAATTT AAATT 
TCTTGGAATTC C CAG TTGTATATTCATCAC CTTTGT AGCATTTGACAAATTTTATGCTT A 
GCAG CTT CTT C ACTGTTTTGAAAT AAAATAT CCTATTAC CT ACTGA TACAATTATCTGTT 
CTTTGT AT AT CAAAAAATG TG AAATT T ACAC AT AAT TCAAAT AC ATTT AATT AT C C G CT C 
AACCAGAAATG AAATC AC ATCC CTCTACTAT ACTACATCCAGCTCCAAGCC CAAGATATT 
TAAATGACATCCATTCCTCTCCTAGTTCCAGTTATGATTTTATCTTGATATTCTCTCATA 
TATGAACTAAATTATAAAGTTAGCCACCATCAATACAATCTGCGTATCTAATATCTTAAC 
TATATAGTAATGGGGTAAGGGAACAGCAAAAAGGAGAACATTAATTAAAATATACAAGTA 
AGCCTGGGCAACATAGTGAGACCCCATCTCTTAAAAAAAAAATTAGCCATGCATGATGGT 
ATGCCTCTAGTCCCAGCTACTTGGGAGGCTGAGGTAGGAGGATCACTTGCTCCCAGGAGG 
TTCAAGGTTCTAAACCAGCAAAGCTCAGAATCCCAGGGGATAGAAACAAAGACTTAGTGG 
ATCACTAGTATTAAACTGAGACACGTCACCCTGCATTGCACTTTGTTTCTCAGTTCTTTG 
ATGAAATCACTGAGCTGACATACCTGCCCTCTTTTCACCATAAAGTGAGTTTCATGATCA 
GAAGCAATGTCTATGGGATAGCCTAACAAACAATGTAAAAACCATTTAGTAAGTTCATGA 
AGGGTGGTGGTGGTAAAAATTTGGAGAACATACAAAACAAATACAATTCCAAGGTGTGTC 
CCCTCCAGGAAGGACAAATTGCTGCCTGCTCTGTGATAGAAGAGGATCAGATGTAATCAA 
CCTGCCGTCAGACTTGGGCTGTTCTCTCCTGGGTGTGGACTTGCCTGGTTGGTCACTGCT 
GCTGACAAGTAGGCTGTCAATATAGCTGGGTTGTCATGTCAGCTGTGGTGAGGGGGAAGT 
CCA^TTGTGGAGGCCACATCCCTGCACTCTTGGCCAATTTGACCATGAATCTTAAGCAC 
TG GGGTGGCTGG AAAAG ACAGC CGATTGACATCCATACAGAGGTCATCTTG AC CAC TTGA 
TTAGTATAAGCACTGAAGGCTTTTAACTGAGCATTCACATAGGACACAAATATTCTGATT 
CTTTGGGCCCATTCCAAGAACTCTGGGCATACTTTTCCTCCAGACCTCATACCCAGTTGT 
GTTCTTTCC^UUVTTTCTGGTCATCTGGTTATGTTATTAGCCACTATCTGTGAATCAGCAT 
AGATTTTTATATCAGACATCTCTACCTCCTGACAGAATGGAGGAGATATGTTACTTAACA 
ATTCTGTTCCCTTGGAAGATTTCCTGTCTCCACTGTTTGTAAGGGCTACTCCCTCAATGT 
AGCAGTAATGCTTTCACTCTGATGGGAAGTCACAGTGGAATTCTGGGTCTCCAAGAATTA 
GTGTTAGTGCATACACAGTGTCTGATAATCCCCAGAGTGTCTGGTGCCCTTGGATCCTGT 
GAAGAAGGCTTGGAGAAAAGAAGATTCATGGCAAGAACTTGTGATGTGATGACAGGGCCT 
TTTCTCTGGCTCTTCATTCTTAGTCTGACCTAGGTGTGAGAATTAGGTCAGGGGCCATGA 
CTATATTGTGGTGACTCAAACCAGGCCTTTGTTTACTAACTGGGAGATTTTTACATTGTA 
AGAATCAAGTAGGATCTTTGCC»TGTATTTTGGTCTTAAGAACACAAATGATATGGCTC 
CAATGACTGGAGGAACACCAGGGTCCTTGGTCTCACGCTGATTTAGATAAAACGACrGTC 
AGGCCTCTGAGCCCAAGCTAAGCCATCCTCCCCTGTGACCTGCACGTATACATCCAGATG 
GCCTGAAGTAACCAAAGAATCACAAAAGCAGTGAAAATGGCCTGTTCCTGCCTTAACTGA 
TGACATTCCACCATTGTGATTTGTTCCTGCCCCATCTTAACTGAGCGATTAACCTTGTGA 
AATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCC 
CCTAAGAGAAAA CCCCCTTTGA TTATAA TTTTCCA CTA CCCA CCCAAA TCCTA TAAAA TG 
GCCCCACCCCTATCTCCCTTCGCTGACTCCTTTTTCGGACTCAGCCCGCCTGCACCCAGG 
TG AAATAAA CAGCCTTGTTGCTCACACAAAGCCTGTTTGGTGGACTCTCTTCACACGGAC 
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AAGCTTTAGTAGAGATCTCAAAAATGGTTGGATGGTAGCAAATTACTAAGAACTCTCAAA 
GTTTCTAAAGCCTTAGTTTCAGCTTGCTAGAAAACCTATGTTGAGTATTATGGCTAGTTC 
CATAGTTGAGTTGGGAAATGTCTTTGAGGAGACACTTTTTCACTTTGTATTCATCTGTAC 
ATTTTCTGTTACTTGCATTCTGTCATGCTCAGGCTATTAGAGCAGGTACAT*T"rrrATAAC 
TGGAATGTTTATGTGTAGTGAAGCTCTGAGAGGACTTTGCATTAGATCTCAGCAGCATAA 
TCAGAAGGTTGTCCTTTGTCTCAGCAATTTTTAAGCTAATAGTAGCAGAAATTG 
AAATAGACTGCTTTGCCACAACATTCAGAAAATCATTOATClTriVATTGCAGTTCTTGT 
CACCAAACAAT ACATTTT AGT ACTT CT CAAATTG CAG AACT CT CAT AGGG C TGG G AAAAT 
GCCTGTAGACACATACATACTATGAATGTGCTAATGTTTTTTGTATTTTCATAGCCCATC 
AAAGCTCCTGAGTCAGTTTCCACTATAATCACTGCAGAATCAATCTTCTACAAGGTAAGC 
TTTTGTAG AG TT ACTGAAGGAAG AG TTGGGC CT AG TG GGTAATG TG C C ACT AAAATGTTG 
GATTAGTCTAAAGGTCTCTGCTACTCTTTATTTGTATAAGGTGTGATTATACTTTTTGTT 
C C CTTCTT AG CT G TTTT C C C C CATAAGTGGC TGTTATTAAAACAT C TC AT C TAG AG CTGA 
AGTGGGAGGAGAAAGTGCCTACTGACACATGATGTGAGGATCTTAAGTATTTTTTTTTAG 
TGTAGATTGTAGGAATTATTCTTAAAATGCTGATTGTATAGTGTGGAGCCATGGAAGACT 
.GAGCCGTTAGTGCGATGGCATTGAAGAATGAGAAGGACAGAGACAGGATTTGGACTAGTA 
G AGGTTGTCGACTGTGGTGTCAAATGGGTAG AGTAGGCCCAGAGATTCTAAAATG C CTTT 
AAGTGGAGTTGAGCTGAGTAAGGGCAGTAGTGAGGATTAACACCTACTAGAAATTCATAG 
TGAGAGG AATTC CAAGATGTTTTGAT AAAAG AATGAGGAGGTCAGGTTTC CCAGGGC CAA 
AGTCCATGAAC ATCTGAT ACCTCAGTGAGAG AAGTGACAGATTG TTGTGTTTAAAC CAG A 
AGT CTTAGGAAAGGAATTAGAACATAG ACCC C C AAGG CTCGGCAGGCCTGG CACGG CAC A 
GGCAGCAACCATTGAAGGCTATTTGGTGTTTCGGGATCTGAACTGTCATTTAGGGGACAG 
TGGTGTGAGTTAGTACTTTATACTTGACCCAGGTGGACTGAGAAACTCAAGTGATGATGC 
CCTTAAGTATACTTTTTTTTAAGCCCACAATCTATATAGTCGAAGTCTGTTCCTCCCAAC 
AGGGGTACACTGGCATTCCTCAGCAGGGCTGGGAAAAACCAACAACAAAAAAAGTCTGTA 
CACAGGCAAACATCTCTCTTATTTTTCCAACATTTAATACATTGTTAATAAAATATCTM 
AGTTTAGCAAACAGTTGCTGTGTATCAGTGGCTGAGCATTTTGCATGCTTTATTTCATTC 
AGTTCACTCTATGAGGTGGATACTACTATCCCCATTTTCTAGATGAGAACATTGAGGCAC 
AGCGAGGTTAATTAACTTGTCCAAGATCACATAGCCAACAAGTCATGGAGTGAGGCAGTC 
TCATGCCAGAGCTTAAGCCTAGAGCATAGTTCCTGGCTCTACAGCTTTAGCAAGTGACTG 
GCTATGTGACGAGGACCAACCTCTCTAATGTCTCATCTGTAAAATAGGAATTGTAAATAG 
TTACTAC CTCAGTGGGT CAAATG AAATCATATGTGTT AAGC ACTTAGCAGAGTAAG C ACT 
CAATGAATAGTAGGAGTTATCACATCTTCGTATTTGTGCATTACCTTCACAGTTTACAGA 
TTAAGGCCAGAAGCAACTTGTTGAGCTACGGGTTTAGTGTACTAACAGTTTCCATGTGTG 
TCTCCATGGAAGGGTGTGTGGGACCTGTTATTCTGACTGTCTGTACTTTCGTATTGTTGT 
CTGCCACCCATGTTTATTAAATGATAAGGACAATAATGCAACAAAGTAGTCAAGTAATGT 
TGCAAATGCCCAGTATTGTAGTGGCTATCACAGCAGTGCCACTGGCAGGCAGCACCATGG 
TGGCAAG TTCAAGAGGTCACTGC CAGCCACTGAG CTAGAGC CCAGATCAGG CATG C AAG A 
GGAGCCTGAGTGGGAGCCACTGGGGATCACGGCCAAGAGTGTGACCACCCAAGACCCAGA 
ATGGCTGAGTGGCCTCCCTGGAGCATGGCAGTGGCAGAACAACTCCATGAACTCAGATCT 
GGTGATGCCTAAACTAGTGCTGTTCTCGTGTGGACCCCTTTTCTCTACCAGAAACCTTGA 
AT CCTCT C AGCAAATG AGGAG ACTACTCAG ATCAGTGACTT AGTCCTGTTTGGTGTTATA 
T ATGTGT ACAC AACACAGC AC AT ATT AATAAATACCTACTATGTG C CAGGCACTG CCTAC 
CACTGGAATCTTTCACTAAGACATTGTTTTTACTTTGCATTTCTGCCTTTACACTATGAA 
AGTAGATGTTTTGGATTCATATTCATTCAGCATACATTTGAATATGCTGTGTTATGCATA 
GTAAGCCTATGATAAGCAAGTATTCTCATTTAGAATTTGGGAATATTGATTATACATGTG 
GACAAACAAACCATAAATGCAAACTATTTATATGATAAATAACTTTGGACTGATGGCTGG 
GAGGAAGGACCAGCTATTGATGGGTAGGAACTAGCAAGTAGCGGACTGTGGCCTGCATAG 
ACCAGACCCATCCGTAGTGATCCAGATGAAACAGCCACCCTCAGACACTTGGATAAAGGG 
TCCACCAGGAAAAAACTCCTGGCCTATCAGGTGCTATGTTACAGTTCAGTTACTGGAAGT 
ATTTCCTCAAAAGTGTTTTTATGGTTGAGGTACACATTCCTACAGCTTTACCTGCTGCCA 
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AGTCCCTGTTTCAAGGGAAGCAGCAATGAATTACACTGTTCCCGTAGTCAAGGACAGTAT 
ATCTTACCAAGAACTATACCCACTTAAGGAGGTGCTGGATGTCATAAAGATTTGGATCAA 
C CATT ATGGGTGTTCAGAGGAGAGATTATTTCCAG CTC AAGACCCAGGG AAG AGGACAT A 
GGATGGATACCAGAGTCATAGGGAGGATTTAACACAGGACATGTACACATTAGTTAGTTG 
GGTATAAAGTGGAACAGAAATGAATGAGACACAAAGCCTTGAATGCCAGAAATACTAGTA 
GTCCTGTTGTGGAAGGATATAAAACTCAACTGGGAGTGGAAGAGAAAGGCAGCAGTGAGT 
C T AGGAG ATG T ACAGT AGGTTGAGGT AAACAT AT C C TGAAG ACT AT AATC C AAAG ATT AT 
TTTTGGTTTGAATTTGTTTTGGTTTGAATTCATGGTATCT^ 

TGGGGAGGGTGGCATGTAGAATG CATTCTTACCAAATCAG CATG ATTTTCAAGACAG T AC 
AGAGAAAAGACTG C TG AG CTGATGT AGGAG CTTTGG C TG CAGT CT CT ATG G C TTT C AGCA 
AGCCGTTTAACCTTACTACTGCTTCATGACTGTGGCTAACAAAGTAGGGATAGTACGGAG 
C^CAGAGGATTTTTAGGGCGGTGAAACTATTAATACTCTCTTTGTATGATACTATM 
TGGGTAC ATG TC ATTATACATTTGCC CAACC CC ACAG AATACACAGCACCAAG AGTG AAC 
CCTAATGTGAACTCTGGTCTTTGATGATGCTATGTC^GTGTAC 

GTGTACCACTCTAGTGGTGGGAGGGGTTATTGATAATAGGGGAGGATGTGCATGTGTGGG 

GGCAGGAAGTATATGGG AAAT CTCTCTACTTCTG CTC AATTTTGCTGTAAACCTAAAACC 

TCTGTAAAAAATAAAGTCTATTTTTTAAAAAGTGGGGATGGTATTACGGCAATATAAAAT 

CAA^TACTTTATGAAC AAATCTTTTCTC CAGATGT AAACTGTCAT AT ATG CACCCTCGT 

ATGTGTATGTATAATTTTCATTCAAACGTGAAACAACITTAGAATTGGCACCAAACATAT 

AAAC^CTGATACATTAGACTATCTCGAAC^CCTTTTACrGACCACTTTGAAAACT^ 

ACCTATTAAGGTTCATTCATAGCTGTG ATGTTCTATTTTTATTTTCAATGTGGGATTATC 

TTCTGTTTCCCCCAGGGAGTATATTACCAAATTGGTGATGTTGTTTCTGTGATTGATGAA 

CAAGATGG AAAGCC CTACTATGCTC AAATCAGAGGTTTTATC CAGGACC AG TATTGCGAG 

AAGAGTGCAGCACTGACGTGGCTCATTCCTACCCTCTCTAGCCCCAGAGACCAATTTGAT 

CCCGCCTCCTATATCATAG GTAAGCTTGACAAATGGCRCAGG'rrTTTTlTTAACTTAGTT 

AACTCTCCAATATTATGTAAAAGAGTGTGTTAGTCAGCTTGGGCTGTCAGGACAAAATAT 

CACAGACTGAGTGGCTTAAACAACAGAAAGTCACTTTCTCACAGTTGTGGAGGCTGAAGT 

CCAACATCAAGGTGCTGGCAACACGGATTTCTGGGGAGGCTTTTCTTCCTGGCATATAGA 

TGGTCACCTTCTTGCTGTGTCCTCACATGGCCrTTCATGGAGTGAGAGCTCTTTGGTGTA 

TCTTCTTATAAGGACACCATTTCTGTCAGATGAGGGCCCCACCCTTATGGTTTCATTTAA 

CCTTAATTGCCTCCCTAAAGGTCTCATCTCCAAGTACCATCACATTGGGGATTAGGGCTT 

CAACATATAAATTTGGAGGGTGGCGGGGGGGGATGCAATTCAGTCCATAACAAAAAAAGC 

ATGAGTATTATTAAGTACAAAAAAATTAGAGAGCTTTATAGAAAATATGAGGCATTTTAT 

GTAGCTGGAGTGTGAGTGCTATCAGTTATTTTGAGTTAGAGCAATGTGCATCTACTAAGA 

AGTGGTATGGATAAGATTTTTTTGGAGTGACCCAGGGTTAAACTGTACTACAAGAATGTA 

TTGCTCAGGAACTAGGTTATTTAGGTTACTTATTTATAO^CCTATTCAAAAATAATTT 

AGGAAAGAACTATCCCAGTTATCCCATACTTGCAAATTCTCAATATGTGTGCCTCTGCAT 

GCTACACATGTCATCTTAGGCCTTTATAGTATAAAGGCTGATAGTTGAAATGGCAGCTGC 

TGTGCTTTTGTTAATTTCAAAGCTGCCAAAACAGTTGTGAGATAGACTCACAAGAATTTA 

CTGATTAATACAATTTTTAAAGTTTTCAGATTTTTACAGTTACTTCAGACTTTTTATCTT 

TCTGCAGTGAGCA.TGCATCATTACTTTTGCATCCTGAGAACAAGCATAAGTGTGTTTTTG 

GAGAGAACTCCAGGGACAAATAATATACCACTGTTATTCTCACCTATATGTCAAGTTTGA 

TAC ATTACC^UIACAATT CTAGC CTTCTGCITATAAGT ATAT AGAATTTTTATTT AC CTTA 

TCTATGGATCAGGATCTCAGCAGAGGCAGTGATGTATCAGAATCACCTTCGGGATTCCTC 

TACTGCCTCCTCTTTCTAATCCCCAGATTCTGATATGCATCCTTGTCCTACAGCGAGGCA 

GCATGGCATGAGGTCAGAACACCAGTTCTGGAGCCAGACTGTCTAGGTTCACAGCCTGCC 

ATTTACCGGCCATGTGACITTGGCAAGTTTCTTAGTCTCTCTTGCCTCACTTTCCTCATA 

TGTAAAATGGGAATAATAATAGTGCCTACCTCAGAAGGTTGATGTGAGGAATGAAGGTAT 

TGATACATGTAAACTTAGAGCAGTGTGGGTACAAAATAAACATGATGCAAGTGTTCAATC 

ACTGTTTTTGGG AG AATG CCATATTCTTTAAG CCGTTAAAG AAG AAAAAATGATT AAGAA 

TAATTTCAAAGTAATGCATGTTTCAAGGGCTAATGCCAGGTTGCTCCCAGAGTGGTCTCT 

CCCAGTGTCTAGAAATTTTAACATCTTATGAAAATGATATATATGGTCAAAAATGTATTT 
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AACCTTTCCCTTGGCTGCCTTCCAG GGCCAGAGGAAGATCrTCCAAGGAAGATGGAATAC 

TTGGAATTTGTTTGTCATGCACC"lTCrGAGTATTTCAAGTCACGGTCATCACCATTTCCC 

ACAGTTCCCACCAGACCAGAGAAGGGCTACATATGGACTCATGTTGGGCCTACTCCTGCA 

ATAACAATTAAGGAATCAGTTGCCAACCATTTGTAG TTCACAAATTAAAACTGGGTTTCC 

AGGCCTGGTGTGGTGGCTCACGCCTGTAGCCCCAGCTATTGCACCACTGCTCTCCAAGCT 

GGGCAATGGAGTCAGATTCTCTTTCTTAAAAAACCACAAAAAAACTGGATTTCCA^ 

CTAATATTCTTAGTACCACAAGATATGTCATAGGTATCTTTAAATGAAATTCTTAGCTGG 

AAAAGTGACTAAAAAGTTTTTCTCCTGCTACCTAGTAATAAACAAATCATTGTTTATTAC 

TGGTCACTTAGAAAATTAAAAGGGATAGGGCCAGGCACAGTGGCTTATGCCTGTAATTGC 

AGCACTTTTAGAGGCCGAGGCAGGCGGATCACCTGAGGTCGGGAAGTGGATCGCCTGAGG 

TCAGGAGTTCGAGACCAGCCTGGCCAACATGGCGAAACCCCGTCGCTACTAAAAATACAA 

AAATTAGCCAGGTGTGGTGGCATGTGCCTGTAATCCCAGCTATTTGGGAGGCTGAGGCAG 

GAGAATCGCCTAAACCCAGGAGGTGGAGGTTGTAGTGAGCCAAGATTGCACCGCTGTGCT 

CCAGCCTGGGCAACAGAGTGAGACTCTTGTCTCGGAAAAAAAAAAAAAAAAAAAAGGCTG 

GGCACAGTGGCTCACGCCTTTAATCCCAGCACTTTGGGAGGCTGAGGCAGATGGATCGCC 

TGAGGTTGGGAGTTCGAGACCAGCCTGGCCAGCATGGTGAAACCCTGTCTCTACTAAAAA 

TACAAAAATTAGCCAGGTGTGGTGGCGCACACCTGTAGTCCCAGCTACTCGGGAGGCTGA 

GGCAGGAGAATTGGTTGAAC C CAGGAGGCGG AGGTTGCAGTGAG CAGAGAT CGTGCCACT 

GCACTCCAGCCTGGGTGGACAGAGCAAGACTCCGTCTCAAAGAAACAAACAAAAAATTAA 

AAGGGATAGAATATAATGAAATATATTTTGAACTTAAATTATATTCTATATGTGTATCTT 

CCTAOTCAAAAGCTGTAATTTCCAGAGAGACCATTAGGAACAGGTAGTATCTATTTTTCT 

CCATTATTTATTTCTAGAAACTCATAAAATGGATTGTATTTTTCTATAAGAACAAAATAT 

TAATTAAGGTATAGATGACTGACCAAGGGCTTAATCAAATAAAATGACTAACAGCATCTA 

TCATAAAGCCACACAAGCCTTATGTTCTCATCTCAAAAATGCTGTGACAGCTTTTTGGCT 

GCTTTAACCATAAGAAAAATGATTGGTGGATGATTTTATTAGCCCAGGCTTTTAAAAACT 

TTCATCTAGGCCACGTGCGGTGGCTCATGCCTGTAATCCCGGCACTTTGGGAGGCCTGAG 

TGGATGGATCACTTGAGGTCAGGAGTTCAGGACCAGCCTGGCCAACATGATGAAACCCTG 

TCTCTACTAAATATACAAAAATTAGTTGGGTGTTATGGTGCATGCCTGTAATCCCAGCTA 

CTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACTCGGGAGGTGGAGATTGCAGTAAGCCG 

AGATCGTGCCACTGCACTCCAGCCTGGGTGATAGAGCAAGACTGTCTCAAAAAAGAAAAA 

AAAGAAAAAATTTTAATTTAATCCTTCTGTAGAAACAGGCATTCAGAACCATTCCATTGA 

TCTTAATAAAG CTGCTCTTTACTGTTTCTAG TCAAAAATGAG ACTT CGATC AAACC ATAA 

GATTTTATACTGCAGATAGTCAGCTTCACCAAAGCCGCAGAGGAAACATGTCGAGATCAG 

GCTTCCTGCTTGATAGTCTCTTGACTACCATTAAAACGAATATTGGGAGGTCATGAAAGT 

CATTGGTAGGCCATTAGCATTGATATCTTTAAAACATCTACCCTAAACCATCTGCTATGG 

ACCCATAATAAGAGG CCTGTTGTATATGAA ATTGTCTAGAATT CAGGTGC AGGTCTTTGC 

CGGTTAAGTAAGGGAGCAACACGTAAAATGGGAGAGGAGTGGGGTGTACTCACTTGCCTC 

CTCI w rTTGTCCTGATTTAACCAGCATTTTTCAACCCTGGGAAAATTTGCAGAATCTAAGT 

TGATTGTAATGATTTTGAGCTGCAGCAGCTTTAACTCTTACCCTTTT^ 

GGTGTTTGAGTTGGAAAGAAACAACTATAGGTAGCTACACGTACATAATTATCTCTTTAT 

TCACAAAGGGTATAGTAAAATTGATTGTAAATAACTTTCTAAGTGCCAATATTCAAAACT 

TTTGGATTAAAATGTAT TTTT CACCGTGC ATTTACTTTGGATGTATTT ATTTCATTTAAA 

C AAT TT AAATGG G G CT C TTT AAC C AAAAATGGT ATTT AAAAC CAAAACAG TAT CG TACT T 

AGAATTTGGAGTAGAGG CCGGGCACAGTGGCTCACG CCTGTAATCCCAG CACTTTGGAAG 

GCTGAGGCAGGCGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGTCAACATGAAAC 

CCCGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCGTGCGCCTATAATCCCA 

GCTAGTCTACTCGGGAGGCTGAGGCAGGAGAATCGCTGGAACTCAGGAGGCAGAGACTGC 

AGTGAGCCGAGATCGCGCCACTGCACTCCAGTCTGGGTGACGGCATGACTCCATCTCCAA 

AAAAAAAAAAAAAAGATTTTGGAGTAGATTCATCATTAATAAGTAACAGATTTTAGGAAA 

ATCAAAAAATGGCTAATAAAATGAACACAATGTAAAACATTTATTAAAATGTAGACTTTT 

AAAAATCTATAAATTGATCATCTGTTTATAAATTGGCAGATGGTTGTGTACCATCTTTTA 

AAATAAAGATTGAATTTCACCCAGTGTGATGGTTCCCATTGCTTATATTTCTCCTGCTGA 
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GGCCGGACCTX^TATGGCCCTGGTCTGTGTTCCCAGCCTTGTTTCCTCATTACCACTAAA 

ATCTTTCCCCTGTATGCCCGCCCAATTT1TCTGGCTCTGAGTCCTTGTTCATACTGTTCT 

CTCCAATTCTACCTTCCAAAGGCCTTTCTTAACACCTTCGGATTCTTTCTTTGAGAACTT 

TCCAGATTCCCATGCCTTTTTGGAATCAATCTCTATCCTATTGTCATCACATTTAAGTTT 

CTACTTCCATCATCCTCACTCCTATCCCTTTGGTCCTGGGATGACAGGGATGCTGTGTTT 

TATTTACTCATCTTTGTAACTTCCACATAACCTAACCCCGGTTCTTGCTTATGGGAGATG 

CTG ATTG T AGGG TCTG AGTT AG AT AC TG TT AACT AAAATG CTTG TTG AT ATTTT AG TT AT 

T AATT CAT ATT AAC TTTGGCTG AAACTTTT AAATT CT ATTG TGAAT AG T C AAG T AAAATT 

TAGATTGTTACATTCTGGGTTAGTATTAGATTGTTTTTAAGATTGTTTTAAACAAGATGT 

TTTT AAG ATG AG TTTT AAAT AGTT CTCTT AAC AC AAAT AAAG CTT AAT ATG AG T ATTTG A 

AGGAAATTATCCCAAACCATTCCAGTTCCTGGCTGTGAAAGGCTTTTCCAGGCCTAATAA 

GTTTT C CA CTT C AG C CG T AAG TAGG TG AAAT CAAAT GAAC AAT AG AGGGAAATGT ATTT A 

TT TG CTTT AT ACACATG CATGTG TG TTGTGT CT ACAT AT AAAC ATT G CAC A C G CT T AG AA 

TGAAGTTTCTGT CATGCC CAGAAAAGGGAGAGGCATTTTTGTGG ATTTTGT CTGGCTGCC 

CTGGGGATGTTTGAAGAACTGTGCTGTTTACTTCATACCAGGTGTGTGAGCCATACCTTT 

GG TAGG AGGG TAT AC CT C CTACAC C C AAG AAAT AT AAG C CAGG AG AAGG TC TG TG C C AAG 

AGAAGGAACCCAAATGACCC^CAAGAGGTGGGCCATTAATTATTGGGTCAGATGCATAAA 

TGC ACAGTAATTTATTTAAG CACCTCTTAATG GTG ACCC AC AAGGAAGATTG CTCGTAGT 

AGCGGAAAGGTTCACAATAAATAAGAGAAAAAAGCAGAATGTAGAACTGTATGATAGCAA 

TT CTG CAAACAAG AAG CATCTTTT AT AAAAG ATGG AAGGAG CC C AG G CAC AG TAG C T CAT 

G CCTGTAATCCCAG CACTTTAAGAGGCTG AGGTGGAGGATC ACTTG AGCTGCAGTG ACCC 

ATGATTGTGCCACCACTCCAGCCTGGGTGATAGAAGTGAGACCTTCTCTCAAAAAAAAAA 

AAAAAAAAAAAAAGAC G GAAATTC C T C C AGAATTTT AACAT G T C AA CAGAG G TTT T CTGC 

AGCTACTTTTTTCAGCTTTATACTTCGCAGTATTTTCCAAATTTTCTCTAACAAGCAGTA 

TTTTCCAAATTTTTTACAATAAGCACACACA.CACACACACGTTTGTTTC 

AACTGGTGGTGAAG^CCGCTGGCTTTTAGTCTATACATATCTAGAATATTTTATAAATA 

GTAGTTCTTAAACCCTTGAAAGGGAGTGAATGACCAGCTGAGAAAATAAAGTCAGTGATT 

TCATTATTTTCCTATATTCACATCATGATTCTAGGAAAGAACTTGGGAGTGACTTCCTTC 

AGCTTCAGCCACTCCTGGGCCAGGCGCATGCTTAGCTCTGTGGTAAAGGTCACCAGCTTC 

TTCTGCAGGGTGCCTGTATCATCTGAATTGGAGGTTTGGCGAGGGTAAGAGACTGATGTA 

GGTTCAAGTTTTTCTTTCCTGTCCTCCACTTGAAATCTGTCTTCCCTTCCAGACTGCCTG 

CGCTGCTGACTTAAGGCCCCAACACCAAACACAGAAGCAACAGCCTTACACAGAGTGTTC 

AG C AAGCTC C?VACAATTGTGTAAGGT AAAGTTTCCTTTAT AGATTC CTTTT CTATATCGC 

TCCTAGTGGTTCTGTTTCTCTGATCGAATTCTGGCTGATAACAGTTGCTGAGACTCTGAA 

AGAGAAGGCAAGGAACTACTGTTTCTCATTATAAACTGTTTAGAATTATTTGGCCATCTT 

TTTGCTATGAATATGTAGTGCTTTGATACATTTTTTAAATCAAAAAGTAATGAAAGAGAT 

CACATAGGGAAAGATAGATTGGATTATTTTTAAAGTTTATATACTAAATTGAAAAGCAAA 

GAATAAAATGGGAGAAACAGCTCCCTCATGTGGCTGTTGGCAGGAAGCTTCCATTCCTCT 

CTGTGGGCCTCCACAGGTTTGCTCACAGCAAATGGTCCGTGACAGAAAGACGCAAGGGCA 

GTTGCAC CCAAGATGGAAGC CACCAT CTTTT CT ATAACCT AATCTGAAAGAAGGGAC ATA 

CCAGCACTTCTGCCATATGCTGTTGGGTCACACAGACCAACTCTGGTACAGTGTGAACAC 

AGGAC CACACAAGGGCGTGAATTC CAAGGG CAGAG AC CACTAGG GACCACC TCAGAGGCA 

CAGAGGGACACCCTATCCAGCTGGTGGCCAATGT AAATT AACAT AG CTTTTTAGAAT AG C 

AATATGTATCTATAATCTT AAAAGTATTAAAAGTACTTCTTG ATCCAG TAATTTCATTT C 

TAAGAATCCATGCTAAGAGGATTTAAAATGTGGACCAAAAAATGGGTATAAAAAGAAGTT 

GTTAACAGTATTTAAAGTTGTGAAAAACCAGAAACAATCTAAAGGTCCAACAATAGGAAA 

ATGAATTTTGATATTTTTCTAATAGAATTTTATGCTGTCATCAGAAATACCATTTACAAA 

TAATTTTTAATAACGCAAAAAAAAGTTTATAAAATGTTTAGTGTAAAACCTGGACACAAC 

TACATAATGATTCTGATTTTGTAAAAAAAAAAAACAAAAACACACACATATACACATGCA 

TACATATGCATATAAAGAAAACTGGAACAAACAAAATAACAAGCATAGTTGGAATTACAG 

TCATTTTAATATTCTTTATGCT'X^TAAAAATTTTGAAGTTTGTATTACTAGCATCCACTA 

CTTACGTAGTCAGGAAAAAAATACAACTTTAAAATAGATATTTAGGTCCAAAGATGGTAA 
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TCTAAATGGTGTTACAGGCTGAATGTGTGCCTGATCCCCATGCCCCAAGTTCATATGTTA 

AAGCCCTGGCCCCCAAGGCAATGGTATTAGGGGAGTAGGGCCTTTGGGAGGTAATCAGAT 

TTCTACGAGGTCATGAGGGTGGAGCCCGCATAGTGGAATTAGTGTCCTTTTAGGAAGAGG 

AGAACAGACCAAAGCCTTCCTTTCTCTCCTCACTATGTAAGAAGACAGCCAGAAGGTGGC 

CACAGCCAGGAAGAGAGCTCTCACCAGAACCCAAATCTGCTAGCACCTTGCTCTTGGGTT 

CTCAGCATCCAGAACTGTGAGAAATGAATGTGTGTTGTTTAAACCACTCAGGCTACGGTA 

TTTTGTTGCAGCAGCCCAAGCTGACAGAGATAGAAACAACACAAGGACCCATCAGCAGAC 

GAATGGATGATCAAAACGTGGTGAGGTCGTGCAGTGGGATATTATTCAGCCGTAGAAGGA 

ATGAAATT CTG AT ACATG CT AT AATC ATG AAC CTTG AAAAC ATGTT AATGGAAAT AAGC C 

AAACTTAAAAGGACAAATATTGTATAATTCCACTTATATGAGTTAGTTACCTAGAATAGG 

CAAATTATGTCATAGATACAGAACATTAGAGGTTACCAGGGTTGTGGGAAGAGGGGTATT 

GTGGGTACAAATTTTCGGTTTGGAGTGATTTTGAAAAAATTCTGGAAATGGGTAG 

G TAG T CAACATG ATG AATGT ACTTAATGACACT AAATTG T ACACTT AAAAA TGG TT AAT A 

CTGGGCTGGCGCAGTGGCTCATGGCTGTAAATCCCAGAACTTTGGGAGGCCAAGACAGGC 

GG AT CATG AGG T CAGG AG ATTGAGAC CATT CTG G C T AACATGG TG AAAC C C T GT CT CTAC 

TAAAAAATAAAAACAAATAAAAAAAAAATTAGCCGGGCATGGTGGCAGGCACCTGTAGTC 

CCAG CTACTCGGGAGGCTGAGG CAGGAGAATGG TGTGACCTGGGAGTCGGAGCTTG CAGT 

GAGCTGAGATCGCGCCACTGCACTCCAGCCTGGGCAACAGAGCCAGATTCCGTCTCAAAA 

AAAAAAAAAAAAAGGTTGATACCTGGGTGCGGTGGCTCATGCCTGTAATTTCAGCACTTT 

GGGAGGCCAAGGCAGGCAGATCAGTTGAGGTCAAGAGTTAAGGACCAGCCTGGCCAACGT 

GGCGAAACCCCATCTCTATTAAAAATACAAAAATTAGTCGAGTGTGGTGGTGGGTGCCTG 

TAGTCCCAGCTGCTGGGAGGATGAGGCCTAGGAATTGCTTGAACCCAGGAGGCAGAGGTT 

GCAGTGAGTTGAGATTGCGCCACTGCACTCCAGCCTGGGGGACAGAGCGAGACTTAGTCT 

CAAAAAAAAGGTTAAAATTGTAAGTTTTGTTATGCATATTTTACCATAATCTTTAAAAAA 

TAGATATATAGGAGATAAAGTCAACAGAATTTAATAACCAGTTGTAAATAGAGACTGAGT 

GAGGAGGATGAATTAAGGAAGACATTGAGTACAACTTTTTGGTAGGTGAAAAACTCTTAA 

AAAAATACGTGGGCAAAGATCCTACTTGATTCTTATAATTTAAAAATCTCCCAGTTAGTA 

AACAAGGCTAGGTGGAGATTTGCATGTGATGTGAGGTGTGTGTTCTGTTTTGTAATGTGA 

GGACTGTGAGCCATCTCCTGGACTTGAATATCCATTAGATAATTGAAAATACGGATTTGA 

GAACTCAGGAGACGTGCAATGCAGTAACAAAACTCTGCACCTAGTTGATTTCTGTCTCCT 

AATTTAATGCTTTTATGGGACAAACTGTTAGGCAGGTGGGCAAGATGGACAGCCATATTT 

TTGTGGGTTTCTGGCCTGTGGGCCAGCCTCAGTGCTCACTCTGAGGTCATGTCCAAACTT 

AGAACACATTCAGGCCTACCACAGTCAAGGCTCCCTTTCTCAACTCTAGTCCTCTGCACA 

AATAT CCGAAGC CTAG AAATAATAATC ATCTGTCCTTGTGTCTTGC ATTATGAAAG C CTA 

GGAAAGGGCCTTGGGAATTAAGAAGAATGGAAAAACTGGTCTAACTGCTGCATGCTTCAG 

CTTGCAGGGGAATCACTGAAATGGGGACAGGCCATAAAAGGACAACCAGAAGAGTGGCTT 

CAGCAAAGGCATCGTTTTTCAGAGCAAGCTAGAGAATCCTGCCAGCGTCCTCAGGCAGGG 

CCCCTGGGCACAGAGGTTAGGCAAGGGAGTGTCCCAGCATGTTGATGCCCTGAGCATCAG 

AATAATGCCATAGAGGAGCTTCCAAAGAGTTCATTTCAGGTTTTGTAAGCCGAACATTTC 

TAGGCAAATAAAATTTGATTTTGTGAATAAAGCTTGTTTCTTCAACTCCAGTGCAGATTC 

TCAT AG ATTG AT AGTGG CTTG TG AT C CAGATAAAG AAAAC AATTTT TCAAAG ATT CAT AT 

TCTTTGTAGATGTACGGATTTAGAGACCATCTAATCTAACTCCCTCATTCTACAGATAGG 

AAAAATGAGGCCTAAAGAAGTTAAGAAAATACCATGGAAATGTCACTGCTGAACTGCCAT 

ACGTAGGATCCGAAAGAAATTGGGTAAATGCTACTGTGAGAAATACAGTACTAGGTCCAA 

AGAATCTAATACAAATTAAAAATCT AAATGTT ATTT CTAAAGCATC C CTGCACATGGCTG 

AACTTACATAGTTTCATTTTCTTTCTTTTCTGTTGAAGAAGAGGCAATTGGCTGGGTGCA 

GTGGCTCATGCCTGTAATCCTGGCACTTTGAGAGGCCGAGGCGGGTGGATCACCTGAGGT 

CAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAA 

AATTAGCTGGCTGTGGTGGCCGCTGCCTGTAATCCCAGCTACTCCAGAGGCTGAGGCAGG 

AGAATTACTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCACGCCATTGCACTC 

TAGCCTGGATGACAAGAGGGAAACTCCATCTCAAAAAAAAAAAGAAAAAAAGCAATCACT 

AACCTGTGTTGTTTATTAAACATGACAGACTGGCATGAAGTAATTACCAAACTGTAAACA 
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AAAAAGCTAC^TCTGCCAGGCATGGTGGCTC^TGCCTGTAATCCCCCACCTTGGGAGGC 

CAGGTTGGGGGATCACCTGAGGCCTGGAGTTCAAGACTAGCCTGGTCAACATGGTGAAAC 

CTCGTCTCTACTAAAAATACAAAAATTAGCCCGGCGTGGTGGCACATCCCTGTAATCCCA 

GTTACTCAGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGCAGTGGGGAGGTTGCAGT 

GAGCCAAGATCGCACCGTTGTACTCCAGTCTGGGCCGACAGAGTGAGACTCGGTCTCAAA 

AAAAAG AAAAAAGAAAAGCTACAAC CTT AAT CTCAACTT CT CAT AACAT CAT CT CT ACTT 

CTGATTAGAAGAGTGGAAGTGGGGAGGTTTATTACAAAAAGACTGTTATACCTTACACA^ 

TTCTCCCCATGAATAGTGAAGGTGTGAGTGAAAAAGACAGCAATTTTATTTT 

AACAGGTTCTTGCACTGTCACCCGGGCTGGAGTGCACTGTTGTGATCACTGCTCACTGCA 

GCCTCCACCTCCCAGGCTCAAGTGATC.CTCCTACCTCAGCCTCCTGAGTAGCTGGGACCA 

CAGTTG TG C ACT AC CATG CCCAG CT ATTTTTnTT AAG AG ATGGGG T CTCACT AT ATTGC 

TTAGGCTAGTTCTCAAACTCCTGGCCTCAAGCAGTCCTCCGACCTTGGCCTCCCAAAGGG 

TTGTGATTACAGGCATAAGCCACCACACCCAGCCAGCAGTTTTAGAATAAAGGGTGAAGG 

TGCTGTTGGGGAAATATAATTTAAAAAACAAAATCTTCTCTCAACCCAGAAATCCTCTCC 

ATGAAGGCAGTAGAGAAAGATAAGCTTTATTATTGAATAAAAATTAAATGAGAATGTGAT 

G CACATC ACAGGC ACTTTGCT AAGAGATCAC AAAGACAG AAGGAAATTTCAC CATTTTGT 

AC AGC CAAGC AGGTACAG CC C ATTACATGTATGTTTTCG AGATAAAT AGTC CTCAACT AA 

GAGAACTTGACAGCACCACTGGTCACACAGTTCATTCTAACTTTACCTGATAATTGATGT 

GACCACTTGTGTTATCTAAGATATCAACTTTTCGGGGGTGGGGGAGTGTGGAAACAGGAG 

TT ACTTTT AT AG C TTGG TGCAAGG T ACT CATT AAG ATT AGG CT GTT A C C CT C C CACAG AA 

ACTGGAAGATAGGTATGCTATCTGGTAATGTTTACATTTCCCAGATCCTTGAGAAAGACA 

TTCCTAGGTCATAAAGCTGACAAAAGGCTGATTCAGTTTTTAAATATATATATCTGTATA 

TGTATTTCA 

FIGURE 15.6 



WO 99/67395 



PCT/FR99/01513 



39/64 

actgagagacaggactagctggatttcctaggctgactaagaatccctaagcctagctgg 

1 1 1 1 M M I i I II 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 illlllllll lllllllllllllll 

actgagagacaggactagctggatttcccaggccgactaagaattcctaagcctagctgg 
g-aaggtgaccacatccacctttaaacacggggcttgcaacttagctcacacctgaccaa 

I Ml 1 1 INI I II II II I II 1 1 111 I I Mill Mil Illlllllll 1 1 1 1 1 1 

ggaaggtgaccacaccctcctttaaacacagagcttgtaactcagctcacacccgaccaa 
tcag agagctcactaaaatgctaattaggc-aaagacaggaggtaaagaaa 

mi iiiiiiiiiiiiiii i 111 1 mi in ii i mi i mm ii 

tcaggtagtaaagagagctcactaaaataccaattaggctaaaaacaggaggtaaagaaa 
tagccaa-tcatctattgcctgagagcacagcaggagggacaatgatcgggatataaacc 

II III IIIIMII I II I MM 1 1 II 1 1 1 1 II I II I III II 1 1 1 II I II 1 II 1 1 1 

taatcaaatcatctatcgcctgagagcacagggggagggacaatgatcgggatataaacc 
caagtcttcgagccggcaacggcaaccccctttgggtcccctccctttgtatgggagctc 

ii i ii inn i n inn inn i in mil i iiiimiiiiim 

caggcatttgagccagatcaggtaaccctctttgggtcccctcacactgtatgggagctc 
tgttttcatgctatttcactctattaaatcttgcaactgcac--tcttctggtccatgtt 

mi iimimi inn iimiiiiiiii miimmnm 

tgtt ttcactctattaaatcttgcaactgcacactcttctggtccatgtt 

tcttacggcttgagctgagctttcgctcgccatccaccactgctgtttgccgccaccgca 

i ii inn Minium iniiii iiiimmni iimimi mi 

tgttccggctcaagctgagcttttgctcgccgtccaccactgctgaatgccgccattgca 
gacccgccgctgactcccatccctctggatcatgcagggtgtccgctgtgctcctgatcc 

mi in inn in him nm mi imiiini iininin 

gacctgcccttgacttccacccctccggatccggcagagtgtccgctgcactcctgatcc 
agcgaggcacccattgccgctcccaatcgggctaaaggcttgccattgttcctgcatggc 

1 1 1 1 1 1 1 1 M II M 1 1 1 1 Mill III 1 1 MM Mill I Mill MM I MM I II 

agcgaggcacccattgccactcccgatcaggctaaaggcttgccattgttcctgcacagc 
taagtgcctgggttcatcctaattgagctgaacactagtcactgggttccatggttctct 

I Ml Ml MM Ml Mill I II Illlllllll III Illlllllll IIIIMII 

taagtgcctgggttcatcctaatcaggctgaacactggtcgctgggttccacggttctct 
tctgtgacccacagcttctaatagagctataacactcaccgcatggcccaaggttccatt 

II INI IIMIIMIIIIIII IMIMIIIIMIII! 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 

tccatgactcacagcttctaatagagctataacactcaccacatggcccaaggttccatt 
cctt-gaatccataaggccaagaaccccaggtcagagaacacgaggcttgccaccatctt 

i ii miiiii iiiiMiiiiiiiiM mil mi i mi in iinin 

cgttggaatccatgaggccaagaaccccaggtcagagaataaaaggcccgcc-ccatctt 

gggag 

Mill 
gggag 
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TCCTGTGAAC 
CTAAAATCA7 
CCCTCTTTCA 
CAAGAG777C 
CTTTCTAAGG 
TCTGCCACTC 
AGTTGTCCTG 
TCTGATGGGG 
CAACTCACCC 
CATGAAACCC 
CTCCATGAGG 
AGGCCATA7G 
ACCACTTCCG 
CTCACCTGTG 
GTAACTCCTC 
TCAGCCTATC 
CCCCCTATGA 
AACAAAAGAG 
ACTGGCATTG 
AATGGGGACA 
CTAGCAGCAG 
GGAACCTGTT 
ACTGAGAAAG 
ACTGGACCCT 
CTAGCAGCTA 
TTTGTCTCTT 
ACTAAGATCT 
ATCAAAGGCA 
GCAGGAAGCA 



CTCTAGAGGA TTTGCGCCTG 
AAATCCCCAT GGCCCTCCCT 
CTCTCACTGC ACCCCC7CCA 
TATGGAGAAT GCAGCGTCCC 
GAACCCCCAC CTTCACTGCC 
TTTGCATGCA TGCAAATACT 
GAGGACTTGG AGTCACTGTC 
GTGGAGTTCA AGATCAGGCA 
GGGTACATGG CACCTCTAGC 
TCCGTACCCA TACTCGCCTG 
TCTCGGCCCA AAACCCTACT 
TTTCAATCCC TGTACCTGAA 
TTTTAGTAGG ACCTCTTGTT 
TAAAATTTAG CAATACTACA 
CCACACAAAT AGTCTGCCTA 
GTTGTTTGAA TGGCTCTTCA 
CCATCTACAC TGAACAAGAT 
TACCCATTCT TCCTTTTGTT 
GCGGTATCAC AACCTCTACT 
TGGAACGGGT CGCCGACTCC 
TAGTCCTTCA AAATCGAAGA 
TATTTTTAGG GGAAGAATGC 
TTAAAGAAAT TCGAGATCGA 
GGGGCCTCCT CAGCCAATGG 
TAATATTGCT ACTCCTCTTT 
CCAGAATCGA AGCTGTAAAA 
ACCGCAGACC CCTGGACCGG 
CCCCTCCTGA GGAAATCTCA 
GTTAGAGCGG TCTCGGCCAA 
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CT CTTCAAAC AACAACCAGG 
TATCATATTT TTCTCTTTAC 
TGCCGCTGTA TGACCAGTAG 
GGAAATATTG ATGCCCCATC 
CACACCCATA TGCCCCGCAA 
CATTATTGGA CAGGAAAAAT 
TGTTGGACTT ACTTCACCCA 
AGAGAAAAAC ATGTAAAAGA 
CCCTACAAAG GACTAGATCT 
GTAAGCCTAT TTAATACCAC 
AACTGTTGGA TATGCCTCCC 
CAATGGAACA ACTTCAGCAC 
TCCAATCTGG AAATAACCCA 
TACACAACCA ACTCCCAATG 
CCCTCAGGAA TATTTTTTGT 
GAATCTATGT GCTTCCTCTC 
TTATACAGTT ATGTCATATC 
ATAGGAGCAG GAGTGCTAGG 
CAGTTCTACT ACAAACTATC 
CTGGTCACCT TGCAAGATCA 
GCTTTAGACT TGCTAACCGC 
TGTTATTATG TTAATCAATC 
ATACAACGTA GAGCAGAGGA 
ATGCCCTGGA TTCTCCCCTT 
GGACCCTGTA TCTTTAACCT 
CTACAAATGG AGCCCAAGAT 
CCTGCTAGCC CACGATCTGA 
GCTGCACAAC CTCTACTACG 
CCTCCCCAAC AGCACTTAGG 

FIGURE 17 



AGGAAAGTAA 7560 

TGTTCT7T7A 7920 

CTCCCCTTAC 7 930 

GTATAGGAGT 804 0 

CTGCTATCAC 8 ICO 

GATTAATCCT 8160 

AACTGGTA7G 8220 

AGTAATCTCC 8290 

CTCAAAACTA 8340 

CCTCACTGGG 8400 

CCTGAACTTC 84 50 

AGAAATAAAC 8520 

TACCTCAAAC 8580 

CATCAGGTGG 8640 

CTGTGGTACC 8700 

ATTCTTAGTG 87 50 

TAAGCCCCGC 8B20 

TGCACTAGGT 8880 

TCAAGAACTA 8940 

ACTTAACTCC 9000 

TGAAAGAGGG 9060 

CGGAATCGTC 9120 

GCTTCGAAAC 9180 

CTTAGGACCT 9240 

CCTTGTTAAC 9300 

GCAGTCCAAG 9350 

TGTTAATGAC 94 20 

CCCCAATTCA 9480 

TTTTCCTGTT 9540 



WO 99/67395 



PCT/FR99/01513 



41/64 

AAG CTCCTT CAGGAGAACAAAGAACAGGC CATTACCCTGG AGAAGACTGGC AACTG ATTTTAC C C ACAAG CC CAA 
LysLeiiLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn . . . PheTyrProGlnAlaGln 
SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
AlaProSerGlyGluGlnArgThrGIyHisTyrProGlyGluAspTrpGlnLeuIleLeuProThrSerProAsn 

ACCTCAGGGATTTCAGT ATCT ACTAGTCTGGGTAGATACTTTCACGGGTTGGG CAG AGGC CTTCC^ T AGG AC 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu . . . Asp 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGlyTrpAlaGluMaPheProCysArgThr 
LeuArgAspPheSerlleTyr . . .SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGlyGln 

AGAAAAGGCCCAAGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGAGGCTTA^ 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProArgLeuThr 
GluLysAlaGlnGluVallleLysAlaLeuValHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
LysArgProLysArg ArgHis. . . PheMETLys . . . PheProAspSerAspPheProGluAlaTyrArg 

GAGTGACAATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTT 
Glu. . .Gin. . .ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerlieu 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
ValThrlleAlaLeuLeuSerArgProGln. . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 

ACACTG CG CCTGAAGGCCACAGTC CT C AGGG AAGGTCG AGAAAATG AATGAAAC ACTCAAAGGAC ATCTAAAAAA 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGlu . . . AsnThrGlnArgThrSerLysLys 
HisCysAla. . . ArgProGlnSerSerGlyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
ThrAlaProGluGlyHisSerProGlnGIyArgSerArgLys. . .METLysHisSerLysAspIle . . .LysSer 

GCAAACCCAGGAAACCCACCTCACATGGCCTGCTCTGTTGCCTATAGCCTTAAAAAGAATCTGCAACTTTCC^ 

385 395 405 415 425 435 445 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGln 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pro. . .LysGluSerAlaThrPheProLys 

AAAAGCAGGACTTAGCCCATACGAAATGCTGTATGGAAGGCCCTTCATAACCAATGACCTTGTGCTTGACCCAAG 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . .ProCysAla. . . ProLys 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 

ACAGCCAACTT AGTTGC AGACATCAC CTC CTTAG CCAAATATCAAC AAGTTCTTAAAACATTACAAGG AACCT AT 
ThrAlaAsnLeuValAlaA^pIleThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGlyThrTyr 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . AsnlleThrArgAsnLeuSer 

CCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACATGGTATTAGTCAAGTCCCTTCCCTCTAATTCCCCA 
Pro . . .GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
LeuArgArgGlyLysArgThrlleProProLeu. . .HisGlylleSerGlnValProSerLeu. . .PheProIle 

TCCCTAGATACATCCTGGGAAGGACCCTACCCAGTCATTTTATCTACCCCAACTGCGGTTAAAGTGGCTGGAGTG 
SerLeuAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGlyVal 
Pro. . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGlyTrpSerGly 
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GAGTCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGC 

GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerLeuGlyTyrlleThrLeuGluSerAsnProGiyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr. . . LysSerArgArgGlnArg . . . 

AG CTATT C CTGTGAACCTCTAGAGGATTTG CGC CTG CTCTTCAAACAACAACCAGGAGG AAAGT AACTAAAAT CA 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
AlalleProValAsrxLeu. . . Argil eCysAlaCysSer Ser AsnAsnAsnGlnGluGluSer Asn . . .AsnHis 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 

TAAATCCCCATGGCCCTCCCTTATCATATTTTTCTCTTTACTGTTCTTTTACCCTCTTTCACTCT 
. . . ileProMETAlaLeuProTvrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeu ThrAlaPro 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 

CCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGTCCCGGAAATATT 
ProProCvsArgCvsMETThrSerSerSerProTvrGlnGluPheLeuTrpAraMETGlriArQ ProGlvAsnlle 
LeuHisAlaAlaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 

GATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGCCCACACCCATATGCCCCGCAACTGC 
AsDAlaProSerTvrArgSerLeuSerLvsGlvThrProThrPheThrAlaHisThrHisMETProAraAsnCvs 
METProHisArglleGlyvalPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
CysProIleVal . . .GluSerPhe. . .GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 

TATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCT 
TvrHisSerAlaThrLeuCvsMETHisAlaAsnThrHisTvrTrpThrGlvLvsMETIleAsnPro SerCvsPro 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp. . .Ser. . .LeuSerTrp 

GGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGAT 
GlvGlvLeuGlvValThrValCvsTrpThrTvrPheThrGlnThrGlvMETSerAspGlvGlyGlvValGlnAsp 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgThrTrpSerHisCysLeuLeioAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 

CAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACAAA 
GlnAlaArqGluLvsHisValLvsGluVallleSerGlnLeuThrArqValHisGlvThrSerSerPrQTvrLvs 
ArgGlnGluLysAsnMET . . .LysLys. . . SerProAsnSerProGlyTyrMETAlaProLeuAlaProThrLys 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu. . . ProLeuGlnArg 

GGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTATTTAATACCACCCTC 
GlvLeuAspLeuSerLvsLeuHisGluThrLetiArqThrHisThrArcrLeuValSerLeuPheAsnThrThrLeu 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp. . . AlaTyrLeuIleProProSer 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGlyLysProIle . . .TyrHisProHis 

ACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATAT 
ThrGlvLeuHisGluValSerAlaGlnAsnProThrAsnCvsTrpIleCvsLeuProLeuAsnPheAraProTvr 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro . . . ThrSerGlyHisMET 
TrpAlaPro. . .GlyLeuGlyProLysProTyr . . .LeuLeuAspMETProProProGluLeuGlnAlalleCys 

GTTTCAATCCCTGTACCTG^C^TGGAACAACTTCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCT 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlvPro 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . ThrProLeuProPhe AspLeu 

PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
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CTTGTTTCCAATCTGGAAATAACCCATACCTCAAACCTC^ 

LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCvsValLvsPheS erAsnThrThrTvrThrThr 
LeuPheProIleTrpLys. . . ProIleProGlnThrSerProVal . . . AsnLeuAlalleLeuHisThrGInPro 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle. . . GlnTyrTyrlleHisAsnGln 

AACTCCCAATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCT 

AsnSerGlnCvsIleArgTrpValThrProProThrGlnlleValCvsLeuProSerGlvIlePhePh eValCvs 
ThrProAsnAlaSerGlyGly. . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 

GGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATG 
GlvThrSerAlaTyrArqCvsLeuAsnGlvSerSerGluSerMETCvsPheLeuSerPheLeuValProProMET 
ValProGlnProIleValVal . . .METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrVaiLeuProLeuIleLeuSerAlaProTyrAsp 



ACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCTTCCT 
ThrlleTvrThrGluGlnAspLeuTvrSerTvrVallleSerLvsProArcyAsnLysAraValProIleLeuPro 
ProSerThrLenAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
HisLeuHis. . .ThrArgPhelleGlnLeuCysHisIle. . . AlaProGlnGlnLysSerThrHisSerSerPhe 

TTTGTTATAGGAG CAGGAGTG CTAGGTGCACTAGGT ACTGG CATTGGCGGTATCAC AACCTCTACTC AGTTCTAC 
PheVallleGlvAlaGlvValLeuGlvAlaLeuGlvThrGlvIleGlvGlvIleThrThrSerThrGinPheTvr 
LeuLeu. . .GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 

TACAAACTATCTCAAGAACTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTT 
TvrLvsLeuSerGlnGluLeuAsnGlyAsDMETGlxiArqValAlaAsDSerLeuValThrLeuGlnAspGlnLeu 
ThrAsnTyrLeuLys Asn . . . METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 

AACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGGGAACCTGT 
AsnSerLeuAlaAlaValValLeuGlnAsnArqAraAlaLeuAspLeuLeuThrAlaGluArqGlvGlvThrCvs 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . .ThrCys. . . ProLeuLysGluGlyGluProVal 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 

TTATTTTT AGGGG AAGAATG CTGTTATTATGTTAAT CAATCCGGAATCGTC ACTG AG AAAGTT AAAGAAATTCGA 
LeuPheLeuGlvGluGluCvsCvsTvrTvxValAsnGlnSerGXvIleValThrGluLvsValLvsGluIleAra 
TyrPhe . . .GlyLysAsnAlaVallleMETLeuIleAsnProGluSerSerLeuArgLysLeuLysLysPheGlu 
IlePheArgGlyArgMETLeuLeuLeuCys. . . SerlleArgAsnArgHis . . .GluSer. . . ArgAsnSerArg 

GATCGAATACAACGTAGAGCAGAGGAGCTTCGAAACACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGG 
AspArQlleGlnArqArqAlaGIuGluLeuArqAsnThrGlvProTrpGlvLeuLeuSerGlnTrpMSTProTrp 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAlaLeuAsp 

ATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTT 
IleLeuProPheLeuGlyProLeuAlaAlallelleLeuIieuLeuLeuPheGlvProCvsIlePheAsnLeuLeu 
PheSerProSer . . .AspLeu. . .GlnLeu. . .TyrCysTyrSerSerLeuAspProValSerLeuThrSerLeu 
SerProLeuLeiiArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu . . . ProProCys 
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GTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTACAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATC 
ValAsnPheValSerSerArcrlleGluAlaValLvsLeuGlnMETGluProLvsMETGlnSerLvsThrLvsIle 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyxLysTrpSerProArgCysSerProArgLeuArgSer 
. . .LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAlaValGlnAsp. . .AspLeu 

TACCGCAGACCCCTGGACCGGCCTGCTAGCCCACGATCTGATC^ 

TvTArqAraProLeiiAspArqProAlaSerProAraSerAspValAsnAspIleLvsGlvThrProProGluGlu 
ThrAlaAspProTrpThrGlyl^uLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLe^ 
ProGlnThrProGlyProAlaCys . . .ProThrlle. . .Cys HisGlnArgHisProSer . . .GXyAsn 



ATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCA 
IleSerAlaAlaGlnProLeuLeuArqProAsnSerAlaGlvSerSer . . . SerGlyArgArgProThrSerPro 
SerGlnLeuHisAsnJJeuTyrTyxAlaProIleGlnGlnGluMaValArgAlaValValGlyGlnProProGln 
LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsn 

ACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 
ThrAlaLeuArgPheSerCys . . . AspGlyGly 
GlnHisLeuGlyPheProValGluMETGly 
SerThr. . .ValPheLeuLeuArgTrpGly 
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LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGiyAsn. . . PheTyr ProGlr.AlaGir. 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGIyArgGlyLeuProLeu . . . Asp 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlieArgThrSerProArgLeuThr 
Glu. . .Gin. . . ProCysPheProGlyHisSerAsnProGIySerlleProGiyValArgTyrThrlieSerLeu 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGIu . . . AsnThrGlnArgThrSerLysLys 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . . ProCysAla. . . ProLys 
ThrAlaAsnLeuValAlaAspIIeThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGIyThrTyr 
Pro . . . GluGluGlyLysGluLeuPheHis ProCysAspMETValLeuValLysSerLeuProSerAsnSer Pro 
SerLeuAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGiyVal 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
. . . IleProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeuThrAlaPro 
ProProCysArgCysMETThrSerSerSerProTyrGlnGluPheLeuTrpArgMETGlnArgProGlyAsnlle 
AspAlaProSerTyrArgSerLeuSerLysGlyThrProThrPheThrAlaHisThrHisMETProArgAsnCys 
TyrHisSerAlaThrLeuCysMETHisAlaAsnThrHisTyrTrpThrGlyLysMETIleAsnProSerCysPro 
GlyGlyLeuGlyValThrValCysTrpThrTyrPheThrGlnThrGlyMETSerAspGlyGlyGlyValGlnAsp 
GlnAlaArgGluLysHisValLysGluVallleSerGlnLeuThrArgValHisGlyThrSerSerProTyrLys 
GlyLeuAspLeuSerLysLeuHisGluThrLeuArgThrHisThrArgLeuValSerLeuPheAsnThrThrLeu 
ThrGlyLeuHisGluValSerAlaGlnAsnProThrAsnCysTrpIleCysLeuProLeuAsnPheArgProTyr 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlyPro 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCysValLysPheSerAsnThrThrTyrThrThr 
AsnSerGlnCysIleArgTrpValThrProProThrGlnlleValCysLeuProSerGlyllePhePheValCys 
GlyThrSerAiaTyrArgCysLeuAsnGlySerSerGluSerMETCysPheLeuSerPheLeuValProProMET 
ThrlleTyrThrGluGlnAspLeuTyrSerTyrVallleSerLysProArgAsnLysArgValProIleLeuPro 
PheVallleGlyAlaGlyValLeuGlyAlaLeuGlyThrGlylleGlyGlylleThrThrSerThrGlnPheTyr 
TyrLysLeuSerGlnGluLeuAsnGlyAspMETGluArgValAlaAspSerLeuValThrLeuGlnAspGInLeu 
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AsnSerLeuMaAlaValValLeuGinAsnArgArgAlaLeuAspLeu^euThrAiaGluArgGlyGIyThrCys 
LeuPheLeuGlyGluGluCysCysTyrTyrVaiAsnGlnSerGlylleValThrGIuLysValLysGluIieArc 
AspArgIleGlnArgArgAlaGluGluLeuArgAsnThrGlyPro?rpGlyLeuLeuSerGlnTrpMZT?roTrc 
IleLeuProPheLeuGlyProLeuAlaAlalielleLeuLeuLeuLeuPheGlyProCysIlePheAsnLeuLeu 
ValAsnPheValSerSerArglleGluAiaValLysLeuGlnMETGluProLysMETGlnSerLysThrLysIle 
TyrArgArcProLeuAspArgProAlaSerProArgSerAspValAsnAspIIeLysGlyThrProProGiuGlu 
IleSerAlaAlaGlnProLeuLeuArgProAsnSerAlaGlySerSer . . . SerGiyArgArgProThrSerPro 
ThrAlaLeuArgPheSerCys. . .AspGiyGly 
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SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAiaThrAspPheThrHisLysProLys 
ProGlnGlyPheGlnTyrLeuLeuValTrpVaiAspThr?heThrGiy?rpAlaGixaia?he?roCysArgThr 
GluLysAlaGlnGluVallleLysAiaLeuVaiHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
HisCysAla . . . ArgProGlnSerSerGIyLysValGluLysMETAsnGIuThrLeuLysGlyHisLeuLysLys 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIIeAlaJLeuLysArglleCysAsnPheProGlr. 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
Pro. . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
SerLeuGlyTyrlleThrLeuGluSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGInGluThrThrLeu 
AlalleProValAsnLeu. . .ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn. . .AsnHis 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
LeuHisAlaAiaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgGlnGluLysAsnMET. . .LysLys. . . SerProAsnSerProGlyTyrMETAlaProLeuAlaProThrLys 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp. . .AlaTyrLeuIleProProSer 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro. . . ThrSerGlyHisMET 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . .ThrProLeuProPhe AspLeu 

LeuPheProIleTrpLys. . . ProIleProGlnThrSerProVai . . . AsnLeuAlalleLeuHisThrGlnPro 
ThrProAsnAlaSerGlyGly. . .LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
ValProGlnProIleValVal . . .METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
LeuLeu. . . GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
ThrAsnTyrLeuLysAsn. . .METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
ThrPro. . .GlnGln. . .SerPheLysIleGluGluLeu. . .ThrCys. . . ProLeuLysGluGlyGluProVal 

FIGURE 20.1 



WO 99/67395 PCT/FR99/01513 

48/64 

TyrPhe. . .GlyLysAsnAlaVallleMETLeuIIeAsnProGluSerSerLeuArgLysLeuLysLysPheGlu 
IleGluTyrAsnValGluGlnArgSerFheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
PheSerProSer . . .AspLeu. . .GlnLeu. . . TyrCysTyrSerSerLeuAspProVaiSerLeu.r.rSerLeu 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyrLysTrpSerProArgCysSerProArgleuArgSer 
ThrAlaAspProTrpThrGlyLeuLeuAIaHisAspLeuMETLeuMETThrSerLysAlaPrcLeuLetiArgLys 
SerGlnLeuHisAsnLeuTyrTyrAlaProIieGInGlr.GluAlaValArgAlaValValGlyGlnrroProGln 
GlnHisLeuGlyPheProValGluMETGly 
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AlaProSerGlyGluGlnArgThrGlyHisTyr?roGlyGIuAspTrpGlnLeuIleLeu?roT:-rSer?rcAsn 
LeuArgAspPheSerlleTyr . . .SerGly. . . IleLeuSerArgValGIyGlnArgProSerProValGiyGln 

LysArgProLysArg ArgHis. . . PheMETLys . . . PheProAspSerAspPheProGiuAlaTyrArg 

ValThrlleAlaLeuLeuSerArgProGln. . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 
ThrAlaProGluGlyHisSerProGlnGlyArgSerArgLys. . . METLysHisSerLysAspIle . . .LysSer 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pro. . . LysGluSerAlaThrPheProLys 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlrJVsp 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . Asr.IleThrArgAsnLeuSer 
LeuArgArgGlyLysArgThrlleProProLeu. . . HisGlylleSerGInValProSerLeu . . .PheProIle 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly. . . SerGiyTrpSerGly 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGInArg. . . 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 
CysProIleVal . . .GluSerPhe. . .GlyAsnProHisLeuHisCysProHisProTyrAlaProGlni.euL.eu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp. . .Ser. . . LeuSerTrp 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGlnArg 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGlyLysProIle . . . TyrHisProHis 
TrpAlaPro. . .GlyLeuGlyProLysProTyr. . .LeuLeuAspMETProProProGluLeuGlnAlalleCys 
PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysKisHisPheArgPheSerArgThrSer 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . .GlnTyrTyrlleHisAsnGln 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSerPhe 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 
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IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . .GiuSer. . . ArgAsnSerArc 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAiaLeuAsp 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAIaThrProLeuTrpThrLeuTyrLeu . . . FroPrcCys 
. . . LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlriAspAIaValGlnAsp . . .AspLeu 

ProGlnThrProGlyProAiaCys . . .ProThrlle. . .Cys HisGlr.ArgHisProSer . . .GiyAsn 

LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsn 
SerThr. . . ValPheLeuLeuArgTrpGly 

FIGURE 21.2 
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TTGGTCTTAAGAACACAAATGATATGGCTCCAATGACTGGAGGAACACCAGGGTCCTTTO 

TCTCACGCTGATTTAGATAAAACGACTGTCAGGCCTCTGAGCCCAAGCTAAGCCATCCTC 

CCCTGTGACCTGCACGTATACATCCAGATGGCCTGAAGTAACCAAAGAATCACAAAAGCA 

GTGAAAATGGCCTGTTCCTGCCTTAACTGATGACATTCCACCATTGTGATTTGTTCCTGC 

CCCATCTTAACTGAGCGAITAACCTTGTGAAATTCCTTCTCCTGGCTCAAAACCTCCCCC 

ACTGAGCACCTTGTGACCCCCGCCCCTGCCCCTAAGAGAAAACCCCCTTTGATTATAATT 

TTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCTATCTCCCTTCGCTGACTCC 

TTTTTCGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCTCACACAAA 

GCCTGTTTGGTGGACTCTCTTCACACGGACGCTCATGACATTTGGTGCCAAAACCTGGGA 

TAGGAGGACTCCTTCAGGAGACCAGTCCCCTGTCCTTGCCCTCACTCTGTGAGGACATCC 

ACCTACAACCTTGGGTCCTCAGACCAACCAGCCCAAGGAACAGCTCACCAATTTCAAATC 

AGGTAAGCAGTCTTTTCACTCTCTTCTCCAGCCTCTCTTGCTACCCTTCAAACTCCCT 

CTCACTACCCTTCAATCTCCOTGTCCTTCCAATTCCAGTTCTTTTTCATCTCTAGTA 

ACAAAGGAGACACATTTTATCCATGGACCCAAAACTCCAGCACCAGTCACGGACTTGGGA 

AGACAGTCTTCCCTTGGTGTTTAATCACTGCGGGGACGCCTGCCTGATTATTCACCCACA 

CTCCATTGGTGTCTGATCACGGTGGGGACACCTGCCTTGGTCACTCACCCACATTCCCTT 

GGTGGTACGTCAACTGCAAAAGCAGGGGACGCCTGCTTTGGCTGCTCACCCACCCCCTTC 

TCTGTGTCTCTACCTTTCTCTTTAAACTTACCTCCTTCACTATGGGCAAACTTCTGCCCT 

CCATTCCCCCTTCTTCTCCCTTAGCCTGTGTTCTTAAAAACCTAAAACCTCTTCAACTCA 

CACCTGACCTAAAACCTAAATGCCTTATTTTCTTCTGCAACACTGCGTGGCTGCAGTACA 

AACITGATAATAGCTTTAAATGGCCAGAATATGGCACTTTCAATTTCTCCATCCTACAAG 

AT CT AG AT AATTTTTGTGG AAAAATGG AAAAATGGT CTG AG ATG CCTG ACG TC CAGG CAT 

TCTTTTACACATTGGTCCCTCCCTAGTCTCTGCTCCCAATGCGACTCATCCCAAATCTTT 

CTTCTTTCTCTCCTGTCTGTTCCTTCAGTCTCCACCCCAAGCTCTGAGTCCTTTGAATCC 

TCCTTTGCTACAGACCCATCTGAACTCTCCCCTCCTCCCCAGGCTGCTCCTCACCAGGCC 

GAGCCAGGTCCCAATTCTTCCTCAGCCTCTGCTCCCCCACCCTATAATCCTTTTATCACC 

TCCTCTCCTCACACTCAGTCCGGCTTACAGTTTCGTTCTGTGACTAGCCCTCCCCCATCT 

GCCCAACAATTTCCTCTTAAAGAGGTGGCTGGAGCTAAAGGCATAGTCAAGGTTAATGCT 

CCTTTTTCTTTATCTGACCTCTCCCAAATCAGTTAGCGTTTACGCTCTTTTTCATCAAAT 

ATAAAAACCCAGCCAGTTCATGGCCCATCTGGCAACAACCCTTACAGGCTTTACAGCCCT 

AGACCCTGAAGGGTCAGAAGGCCGTCTTATTCTCAATATGCATTTTATTACCCAATCCGC 

TCCCAACATT AAAT AAAG CTC CAAAAATT AAATT CTGG CC CTCAAAC C C C ACAAC AGG AC 

TTAATTAACCTCACTTCAAGGTGTACAAGAATAGAGTAGAGGCAGCCAAGTAGCAACGTA 

TTTGAGTTGCAATTCCTTGCCTCAACTCTGAGAGAAACCCCAGCCACATCTCCAGCAAAC 

AAGAACTTC^U^CACCTGAACrTGCAGCAGCC^GGCGTTCCTCC^GGACG^CCTCCCC^ 

GGATCTTGCTTCAAGTGCCGGAAATCTGACCATTGGGCCAAGGAATGCCTGCAGCCCAGG 

ATTCCTCCTAAGCCACGTCCCATTTGTGCAGGACCCCACTGGAAATCGGACTGTCCAACT 

CACCCGGCAGCCAATCCCAGAGCCCCTGGAACTCTGGCCCAAGGCTCTCTGACTGACTCC 

TTCCCAGATCTTCTCGGCTTAGCAGCTGAAGACTGACACTGCCCGATCACTTCAGAAGTC 

CCCTGGACCATCACGGATACTGAGCTTCAGGTAACTCTCACAGTGGAGGCTAAGTCCATC 

CCCTGTTTAATCGATACAGGGGCTACCCACTCCACATCACCTTCTTTTCAAGGGCCTGTT 

TCCCTTTCCCCCATAACTGTTGTGGGTATTGACGGCCAAGCTTCAAAACCCCTTAAAACT 

CCCCCACTCTGGTGCCAACTTGGACAACATTCTTTTATGCACTCTTTTTCAGTTATCCTC 

ACCTGCCCAGTTCCCTTATTAGGCCGAGACATTTTAACCAAATTATCTGCTTCCCCGACT 

ATTCCTGGGCTACAGCCACATCTCCTTGCCGCCCTTCTTCCCAACCCAAAGCCTCCTTCA 

TATCTTCCTCTCATATCCCCCCACCTTAACCCACAAGTATGGGACACCTCTACTCCCTCC 

CTGGCAACCGATCACACGCCCATTACTATCCCATTAAAACCTAATCACCCTTACCCTGCT 

CAATGCCAGTATCCCATACCACAACAGGCTTTAAAGGGATTGAAGCCTGTTATCACTTGC 
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CTGCTACAGCACGGGCTTCTAAAACCTATAAACTCTCCATACAATTCCCCCATTTTACCT 
GTCTAAAAACCAGATAAGTCTTACAGGTTAGTTCAGAATCTGCACCTTATCAACCAAATT 
GTTTTGCCTATCCACCCTGTAGCACCCAACTCGTACACTCTTTTGTCCTCAATGCCTTCC 
CCCACAACTCACTATTCCGTTCTTGATCTTAAAGATGCTTTTTTCACTATTCCCCTGCAC 
CCCTCATCCCAGCCTCTCTTTG CT1TT ACCTGGACTGACCCTGACACCCATCAGTCCCAG 
CAGCTTACCTGGGCTGTACTGCCGCAAGGCTTCAGGGACAGCCCTCATTACTTCAGCCAA 
GCTCTTTCTCATGATTTACTrTC'lTT^ 

GATGACCTTCTACTTTGTAGCCCCTCCTTTAAATCTTCTCAACAAGACACCCTCCT 

CTTCAACATTTGTTCTCCAAAGGATATCGGGTATCCCCCTCCAAAGCTCAAATTTCTTCT 

CCATCTGTTACATACCTCGGCATAATTCTTCATGAAAACACATGTGCrCTCCCTGCCAAT 

TGCGTCTCCAACTGATCTCTCAAATCCCAACCTCTTCTACAAAACAAGAACTCCT 

TCCTAGGCATGGTTGGATACTTTTGCCTTTGGATACCTGGTTTTGCCATCCTAACAAAAT 

CATTATATAAACTCACAAAAGGAAACCTAGCTGAGCCCATAGATTCTAAATCCTTTCC 

ACTCCTCTTTCCATTCCTTGAAGACAGCTTTAGAGACTGCTCCCACACTAGCTCTCCCTG 

TCTCATCCCAACCCTTTTCATTACACACAGCCGAAGTGCAGGGCTGTGCAGTCGGAATTC 

TTACACAAGGACCGGGACCATGCCCTGTAGCCTTTTTGTCCAAAC^CTTGACCTTACTG 

TTTTAGGCTCGCCATCATGTCTCCATGCGGTAGCTTCCGCTGCCCTAATACTTTTAGAGG 

CCCTCAAAATCACAAACTATGCTCAACTCACTCTCTACAGGTCTCACAACTTCCAAAATC 

TATTTTCTTTCTCACACCrGACGCATATACTTTCTGCTCCCCGGCTCCTTCAGCTGTATT 

CACTCTTTGTTGAGTCTCCCACAATTACCATTCTTCCTGGCCCAGACTTCAATCTGGCCT 

CCCACATTATTCTGGATACCACACCTGACCCTGATGATTGTATGTCTCTGATCTACCTGA 

CATTCACCCCATTTCCCC7VTATTTCCTTCTTTTCTGTTCCTCATGTTGATCACATTTGGT 

TTACTGACGGCAGTTCCACCAGGCCTGATCGCCACTCACCAGCAAAGGCAGGCTATGCTA 

TAGAATCTTCCACATCCATCATTGAGGCTACTGCTCTGCCCCCCTCCACTACCTCTCAGC 

AAGCCGAACTGATTGCCTTAACTCGGGCCTTCACTCTTGCAAAGGGACTACACGTCAATA 

TTTATACTGACTCTAAATATGCCTTCCATATCTTGCACCACCATGCTGTTATATGGGCTG 

AAAGAGGTTTCCTCACTACGCAAGGGTCCTCCATGATTAATGCCTCTTTAATAAAAACTC 

TTCTCAAGGCTGCTTTACTTCCAAAGGAAGCTGGAGTCACACACTGCAAGGGCCACCAAA 

AGGCGTCAGATCCCATTACTCTAGGAAATGCTTATGCTGATAAGGTAGCTAAAGAAGCAC 

CTAGCGTTCCAACTTCTGTCCCTCATGGCCAGTTTTTCTCCTTCCCATCAGTCATTCCCA 

CCTACTCCCCCATTGAAACTTCCGCCTATCAATCTCTTCTCACACAAGGCAAATGGTTCT 

TAGACCAAGGAAAATATCTCCTTCCAGCCTCACAGGCCCATTCTATTCTGTCATCATTTC 

ATAACCTCTTCCATGTAGGTTACAAGCCACTAGTCCACCTCTTAGAACCTCTCATTTCCT 

TCCATCGTGGAAACATATCCTCAAGGAAATCACTTCTCAGTGTTCCATGTGCTATTCTAC 

TACCCCTCAGGGATTGTTCAGGCCCCCTCCCCTCCCTACACATCAAGCTCGGGGATTTGC 

CCCTGCCCAGGACTGGCAAATTGACTTTACTCACATGCCCTGAGTCAGGAAACTAAAATA 

CCTCTTGGTCTGGGTAGACAOTGTCACTGGATGGGTAGAGGCCTTTCCCACAGGGTCTGA 

GAAGGCCACTGCAGTCATTTCTTCCCTTCTGTCAGACATAATTCCTTGGGTTGGCCTTCC 

CACCTCTATACAGTCCAATAACGGAGCAGCCTTTATTAGTCAAATCACCTGAGCAGTTTT 

TCAGGCTCTTGGTATTCAGTGGAACCTTCGTACCCCTTACTGTCCTCAATCTTCAGGAAA 

GGT AG AATGG ACT AATGGT CTTTT AAAAAC ACAC C C C AC C AAACT CAGC CT C C AACTT AA 

AAAGGAGGATAGAGCCCAAAAACTCGCAACCAAGCTAGTAATTATGCTGAACCCCCTTGG 

GCACrCTCTAATTGGATGTCTTAGGTCCTCCCAAATCTTAGTCCTTTAATATCTGTTTTT 

CTCCTTCTCTTATTCGGACCTTGTGTCTTCCGTTTAGTTTTTCAATTCATACAAAACCGC 

ATCCAGGCCATCACCAATCGTTCTATACAATAAATGCTCCTTCTAACAACCCCACAATAT 

CGCCCCTTACCACAAAATCTTCCTTCAGCTTAATCTCTCCCACTCTAGGTTCCCATGCCG 

CCCATAATCCCTCTCGAAGCAGCCCTGAGAAACATAGCCCATTATCTCTCCATACCACCC 

CCAAAATTTTTGCTGCCCCAACACTTCAACACTATTTTACATTATTTTTCTTATTAATAT 
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GATCTCTTGATCCCAGGAGGTCAAGGCTGCAATGAGCTAAGATCAAGCCACTGCATTCCA 

GCCTGAGTGATAGTGGGAGACCTTGTCTTTAAAACACACACACACACACACACACACACG 

AGGGCCTTTGACCACTCTTGAGTAGAAGACTCGAGAAGAACAAAGTAGAAGGCCAGAGAA 

GAACAAAGTTACTTGAAAGATCTCTTATTAAAGAGAATGTACAAGCTATGAAAAAAAAAA 

AACACACACA»CACACAAACCTCATCTGGAATGAAAAAAACATAATGCATTTGGTTTCT 

GG TT C CTTAGGCTGTTATGG AAC AAC CAAAG AA(^TT ATTTTGG TTT CTG AGG T C AG AAC 

TATTTTATTCCCCTCAAGCACACTATGCTTATGGTTTGAGGGAGAATGAGAAATAGGAAA 

CTAGGAACAGGCTGAAATGGTCTAATCTTGACCATCTAATTCTGCAGTGTCTTATTCTCA 

TTCTAAAAGAGAATGGTTATATTCGCTGTTCTAGCATAAAAAGTAATGATAAAAATAAAA 

GATCCCGTATTACCAGACAATAATCCCCTAGACTGTTTTAATGCTTGGTTGAGTATTTGC 

TTATG AT CT CAG ACTTTAAAAGATGG TCTCCCCC T ATG GTG AAG CTTG TT AATT AT G TAG 

GCATCATTAATGTCTGTTTACTTATCAAAATTTTATCATTGTTAGTTGTATTACTACTTG 

ACAGTCCAATTTATTTAATTGAAAAGATTGGTTAACATTTTATAGTCAAAGTAATTGTTT 

CCTGTGTTTTTTCCTGTTTAG GTTATTGGAGTGATGAGTAAAGAATACATACCAAAGGGC 

ACACGTTTTGG ACC CCTAATAGGTGAAATCTAC AC C AATG ACACAGTTCCT AAG AACGC C 

AA. CAGG AAAT ATTTTTGG AGGG T AAG T AAGGG AAATTT CTTCAG AC C CATT AAAT G TT AG 

GAAAAAATGGAG CTAAAAGAGCTGGGTGG CT CACCTTTCTCATCCTGTGCTGAGAAATG C 

TGGGGCTCACCCATAAGTATCCAGCATCCCCATGGACACAGGGAATTCTGAACAAATGTG 

ATGAAACCGATGAAATGTCTGGCCTGTAGGTGGTTAGTGATGGAGATACGGGCTATATGT 

GAATCTTGATTTTTGCAATTCATTAGAGCTTTGTAATGAAAGGAAACAGTTTGTTGC^ 

CTTTAAGG AT AGGTT CATTTG C AT TT C T C CG CAAGG AAG TAG T AAT GAG TT AC C AAG C CT 

TAGATTTGA.CCCCTTTTTGATTTCTTGCTGACTT 

ACAAATGAATTATCTTTTTGGTTTTrrriTTriTGAGATGGAGTCTCACTCTGTCACCAG 

GCTGGAGTGCAATGGCATGATCTCGGCTCACTGCAACCTCCGCCrCCC^ 

TTGTCCTGCCTC^GCCTCCCGAGTAGCTGGGACTAAGGTGCGCGCCACCATGCCCAGTTA 

ATTTTTGTATTTTTAGTAGAGACGGGGTTCCACTATGTTGGCCATGATGGTCTCGATCTC 

TGGACCTCGTGATCCGCCCACCTTGGCCTCCCAAAGTGCTGGAATTACAGGCAAGAGCCA 

CCGCGCCCAGCCAGGAATGACAAATGAATTACCTTATAAGTAAATGCCATTAAGGAAGGA 

TAGCTGGAAGATGGGTTGAGGGGAATGGAGGACCACAGAACTAGTCCTATTTAAATACAT 

GTGCATGGTAAAATGATTCCATTTGACAATAGGTTAATTATCTCATAGCATAAGGAAAAT 

GCTTAACAGT C ATATGCAAGATGATAAGCTTTC CTATAGCATC C AACCAAAAG ATCT AG C 

CAGTACAATTTCCTTTGCTATATTAGGGTTAGAAAGGCCCCCAGAGGTGAACCAATTA^ 

TGGAATCCTTGAATAAAACACTGGATTAGCAGTGAACAGAAAAAAGTCAGATTGCTTTCC 

TT CTT CC CATAG ATGT C TCAGG G ATATTT AGTTT C CT CAG AAG ATAAAG AAT TT AG T AAG 

CGTTTTTTTGTGCATACTTACATGAAATGTACATTATTTGAATTCTTTAAAAAGAAACAG 

CTGCATGATAACAAAAATTGTGTTATGCTTGCTTTAGCTOTTATTTTTC 

TATATCGTTCGGACAAGAAGCTATTCCTAAGAAACAATATTTTTAATCCAGGAAGTTTTT 

CATTTTTAGAAATTTAT CTT ACTATTTCC CAAGCAAAAGAGGGTAGTTACAGATTCACTA 

AGAATGATGTGCTCACAATTTTTATTTAATAATTATTCCT^ 

CTGACTTACAATGGTGGAACCATGAGTGCATTTTTGCCTTTATTG 

CAGAAGTGAGCCACAAAGGTGCATAGTTCITGGAGTTAAAGGTCTGM 

AGCATAAGTCTCATTAATGTGTGATTATTTTGAGAAAAGGCAAGAAGTACCTAAGAATCT 

CCCCCTCACTGTCCAGTTCCCTGTTTCATTTAAAGATTCACTGTAAGTAACTGAAAGGCT 

TTCCTTGGGAGGATTTATTTGAATCAGTCTTTCACA.TGC^ 

CGTTTTTGCTGGCAGGAATATGAACATCTGTTGTGAGGAAAGAAAAAGTTTC^ 

TACACTGCCAAAGAAGGGATGTTCAAGTTGAGAAACCAGTGACATT^ 

TATGAATCAGCGCATTTTAATCTTCTAGATAATATATGGAAGTGCAGGAAGGTGGTAGGA 

AACGGTGTTCATTTTACATATGCGTTATTTTATTCTGTGTGAGTCACTTCA 

CATTGCTGTTTTTAAATGAGGATACAGTAAATTGC^ 

AACATACCCGTAGCTTTAGAAAGCAGTTTCCGCACCAGCGAAGAGTACAAGAGCGATGGA 
ACCCCATGTTCCTGGAAGTTTGCACATCJIGAGTAAACAAACTTGAAAACCCCTCTTGAT^ 
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GCAGAATTCACCCAGCCTTGTTCCATTTTCTCTTAACAAAACACACCGCAAAAGCTCTCA 

CAAGCTGCTTTGATGAAGCCACATGTATTTCCCCCTTCACAATTTACAGGAAGTTACTCT 

TAAAAGAAAGTGATTCTGGTGTTTACCGCCTGTGTTAAAGGGACAGAGTTCCTTTTTATT 

TCTGATAACGTTTGAGCGAAATACAGAAACTATCTGTAGACTAGCATAGTCGGTACGTGA 

GTAAGGAAAAGCAATAACCTGCTGTCCGGTGAGCACAAAATTCCTGCTACGAACAGTGCC 

TTACTGCTGCTTGGAGACTGCAAGTCGCAGATCACACTAGGTATTGACTGATTGTATAAG 

GAAATTT CTT AAAG T CT AAAG T AAAGGTGG T AC CT C CT AAAAAG AG GGG AAG AG AG AAAA 

CTTTGTGTGGAAOTATAAGGAGTGTGTTTATAGTTTCAGTAAGAGTGTACGTTTTAATTT 

TTCTTCTTCCTCTGCCTCTTTGCCAAGTAGCCTGAGTGCATCTGTTATCCAGAAGTAGTA 

TTACTCTAGGACAAACTTCAAATTCTTCATTCTGCGTTGCCTTTAAGGAACAACATACTT 

TCTTCCTGTTCTTTTTCCJVAAAACACACGCCTATGGCTCTGTGTGTGGTGTTTTAGCCAG 

CCrrCCTCCCAGATAAGGGGTTCCCTTCCCTCCTTTGCATTGAAAGGAAAGTGCAAGTCTG 

GACATGTTTATC AAG AGGAAAAGTGACTTCTCAGTAATAG ACTGTC AAATT CGGG C TGCT 

GCCCGAGTGTTCGCTTTGTTATGGCAGGTGAAGTTCACCTTTGCCCCACCCAGTGTTTCC 

ACAAAAAGGCAAGGTTCCAAGTATTCATATGAACAAGTGTTACTTTAGGACTTGGAGGGT 

TGGGGGTGGAGGATGTTTGCATAGTTGAAGCCTTGGGCGGGGGTGTAGGAAACGGCGAGT 

ACAGAGGCCATAGAAAAAGCTAAGACTCAGTTTGACGTCGTCAGCCGGCTTGGTCTTCTA 

CCCAGTGACTCAAAGCACTAAAAGTCAGCATAATCGGAACTGAAGTCAGTAGCATCGCCC 

ATTTGCCATTCACTGCAGTAGCAAAAGTAGTACrCTGTGGTGGGTTAATCGGTTTGAGGC 

AGCTCCTTAAATGAACATTTGTGTTTCAl l, l M riTCTGTTATTTTCCCGAACATGAAAAGAC 

GATAAAACTGAAATGGAAAAGGTAACTGACAAAAGTGTGCCTTACCTGTTTCCGCCCTGA 

TTTCTGCTGATTCAAGACTATTCTGGCTAAACTGATTGGATTCTTTTTCTAACTAGGCAG 

TAGGGGATCAGAAATCACACACGGTACCGGCTGTGTTTATTCTGAGAGGTGCTGGGGAGC 

TTTGGGTCTGACTTCCTTTTACATGCCTGTCTTCTCTTTTGGACA GATCTATTCCAGAGG 

GG AGCTT C ACCACTTCATTGACGGCTTTAATG AAG AG AAAAGCAACTGGATG CG C T ATGT 

GAATCCAGCACACTCTCCCCGGGAGCAAAACCTGGCTGCGTGTCAGAACGGGATGAACAT 

CTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAACTTCTTGTGTGGTATTGTCG 

GGACTTTGCAGAAAGGCTTCACTAC C CTTATCCCGG AGAGC TGAC AATG ATGAATCTCA G 

TAAGTGGATTACAGAACAAAAAAATAAAAAATGCCAGTAATGTCGGTTCTGCCCCTTTGA 

ACTAATAACATGTTGTTTAATTATACGGCTTTGTCATGTGTTGGATGAAGTAGGTGGCTT 

AAGCTAGGGACTAGGAAGAGGAAAAACATTTTTTGAGTCCCTATTAACTATTAGGAAACT 

TGATCATTTAAAAGTATATATATATATGAGGAGCTACCTTGAGTTTTGAATTCAGGATGT 

TACAGGAAGAAATATATGTCCAATTCTAATTTATCCAAAAGCAGTTGGGAGAATTACAGG 

GATTGGTCCAGACATGCTGCGTATGCAAGGTATAGCCCTCATCTGTGGTACTTTGGCAGG 

GCTTAGACTGCATCAAAATATTTATAGATGTACATTTGAGTGTACAGTTAGGAT 

TGGAACATTGTAAGATCATTGCTAGAAAAACTTTGTCATAATTTTTCAATATTATTCTAA 

GTG AATAACCG T AAAG ATTTT ACAT CTT AG CTT C CTT C C TT AC AGT AAAAAAACTAT CT G 

ATCTCTTGATCAGTATTATAGTAGCCACCTATCACTTTATCTTAACAAATTCT 

TTAGGTTTATGTGCTTTTACTTCnTTTATTTGATTAAAATTGCTGTCATGACCTCTCTCT 

GCAGAGGGCTGCATCATTTTGGTCJVTTCTCAAGTGATCTCTTTGAGCAATTTAAGAATTG 

CCATAAiGATTCTAACCTCTGCTGTAACTATGGTTGTGTGTTCTTGGTTAGACCACTAAAT 

CITATTAGCAGTTTTAAAAATTATTCCTTTTGGTTTAGAAGTTAAGA 

TTTTTGTAACTTTTGGTTTTGATATCATTTCAAACTTAAGAAAACATT^ 

CAAAGAATTTCCACTTACCCITTACCCAGGTTTACCAGTTATTGA 

GCTTTACCAGAAGGCTAACTTGTTTTAGTTCTCATTTTCACCl^ 

AATATCAATGTTAAGATAAATTGGAATTTTGACTTTGAT^ 

AAGTACTTACCCTAGTCATATATAATCCAACTGTATGGTTATTTGGTATTCATTCCACAC 
TTCATTTTACTTGATCTCCCHTAAGATTGGAAGACT 
TGGGGCTATAAAAGCATCAGGACCTCCCCCGTAGGGGAGGTC^ 
CACAAGAGGTTACCCTTGAGCTTGAGGAAAAGAACTGGCTCTC^ 

TTAATGGGTCTAATTAGGTCCTGACCAAAAAGGTC^C^GTTCTTTTCCCTCATGTCTCTT 
CAGCGCrCCCCGAGACTCTGGAGACTCTGTCATATCCCTAGGGCTGAGCCTCCCAGGAAC 
CATTCGGCTGTTGTGGCATCTGTGTATGCCATGCCCAGTGCTGAGGACCTAGTAACAAAC 
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GACAAATGCACAGGCACAGTGGCATTTTTGTGGAACTCGTATTCCAGCTGTGMTCTCAG 

AAGAAGCGCACAGCTCCCTCCTGGCTTTCTTAACATAGTGAGCCAC^ 
CTCCTTACATTCCTTGAGTTTAATCATTCATGGATTCAGAGGAAAGTCTTTTGATTTTTG 
CTTTTCTTTAAACAGTTCATTTGAGGTGACCTACCCCAGTGACTTTGCACCAAC^CMlA 
GAAACTTTTTTCCATGCTTCCCGCACCCTGTGCCAATCAAGGGAAGGGTTTAAJ^CCTG 
GOTTTl^ACTCCTCAAAGAAAGGTTTTGCACAGTATTTTAAGGTr 



GCGTTTTTATTCCTCAAAGAAAGGTTTTGCACAGTATTTTAAGGTTwahvj iu^iv.. 
TATTTATGCAGTATGTCCCCTTTTATTTTGGCAGAATTTTCT^ 

TTTTCAW3CACATTTCATTGTCCAATATTCATAGTAAAGAATGAGAGTTAACAATAACCA 

gtcacactaaaacSgattcctgctgccagttgtgaaaccggttgtcttaggcgtggcag 

CTGATGATTGAGA^TCTGATCAGGAAAATTTCCACTATTTCATCAGGCCTAAT^ 

™™caaatgaactgtgttgggtttccatgcttaaagcacaatagaggtggtgca 

AGAMC^CATG^GGGCTTAAATGGCAGTGATGGTTCAGGCGGTAGAGTTTGGAGAAGAA 

^Sg^caaaccaaaggaaagaaaagtaagtagccag^ 

TTTCTAAAAACAAAGGAAAAGGAATAAAAGAACTAATAAGTTTGAAACCCCTACCCCTCC 
^^AGGGGGGGAGGTATTTTTTTTCTATCTATCTAACTAA^^TCTAG^ 
^GACCAAATTATAGACTTCTAAATGTTAATCTGCTTTCTCAGTTTCAGTTG^G 
S R mGTmGCCTACTGCAGAACTTCTAGGTTCTTTCTTATAGTCTTGGGGTTCTTA 

ISc^GAAA^CCGTCCGCCTACAGCCATTTAAGATTTCAGAACAAJ^ 
TGATTTTCTTTTTCATGTTAACTCAAGCTGTTGCTGAGTGGGA 

aIc^Stactcagctgctgaa^atgattttttaaaatgcacctttactg™ 

SScC^TTTCCACCTGTAGAGCATCTTAGGGAKCTAACATGTCACTCTGGATG 
TTCTTCTAGAATAAGATGCAAATCTATTTTTCTGAAGGCATTAGAGATAGC 
TTGTGAG^WCTATATACTAGGCACTGTGCTAAGTGTTTTGCATAGAAAG 
^^TTTTGTrGGCCCAATCATAAGTTrCATATCAGTTCAACATTCA^^TATTA 

SaS^gaagaatccctggctaaatgtgaggggcagtgccacagatggactgaaac 

S^^C^^ATGCTATTATTATTTGrrGAATTATAGAACC^GAGTO 
T^a^cSCTGGAAAAAATATGAGACTTAGATACATAATTTGAGTAAAAATGGCTCAAA 

SSSgS^cctatatag^^^ 

^T^__„™^m/^^/^iK^Tv'rr!rrTTnrr:TATCAGTTTTCAAGCTTAGTTGTCTTTCTCA 




ft^TCCCTCTCCCTCAGCAAGCTTTCCAT^CTCCCCCCCCGTCAGCAT^^^^^ 
OTCTTTOQQAATAAQTGCTTTCCTCTTftOCCTSTTCTOTTTTCW 



TCCTTTAGGTAAACCATGAACATCAGAAAGACTTTTATTAACCTATGACAGGGTCCCCAC 
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CCGAGTATTTTTCCACTCCATTAAAATGGAAG T ' lTT ' iTr^ 

AGAGTTTTGCTCTTGTTGCCCAGTCTGGAGTGCAATGGCACAATCTCGGCTCACCACAAC 
CTCCACCTCCCAGATTCAAGCGATTCTTCTGCCTCAGCCTCCCAAGTAGCTGGGATTACA 
GGTGTGCGCCACCACGCCCAGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATG 
TTGGTCAGGCTGGTCTCGAACTTCCGACCTCAGGTGATCCGCCCACCTCGGCCTCCCAAA 
GTGCTGGGATTACAGGCAAGAGCCA.CTGCATCCAGCTTAGGCTATCTTACTCCAGCCTAA 
ACAGCAATTTTCTATCATAAGGTCTGTACTAATGAAAACAGAATCACCCAAGGCTGCTGT 
TTGTTCTGTCTGTGCTGCCATTGTCCGCATTTTGCTGAGGAGGAAACGGAACTGCACTTT 
TGAGTGAGTGGCCCAGAGCCTTCTAGAATGAGAGTGCGTTGGAAGCCAGATATGTGGCGA 
TTGTGTC GC CAG CTGTT ACTCAGG TTTT CT CAAG AAGG AGG AG C AAC TTTGG CAG TTTTG 
CTTCAGTT CTCTCTAGC CCTCTGTGTAATCG CCC Cl'l"rU M rC'rTTATTTCAG C ACAAAC AC 
AGAG CAGTCTAAAGC AACCG AGCACTG AGAAAAATG AACTCTG CCCAAAG AATGTC CCAA 
AG AGAG AG TAC AG C G TG AAAG AAAT C CT AAAATTGG ACTC C AAC C C CT C CAAAGG AAAGG 
ACCTCTACCGTrCTAACATTTCACCCCTmCATCAGAAAAGGACCTCGATGACTTTAGAA 
GACGTGGGAGCCCCGAAATCCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTC 
TGCCAGAAGACTTTTTGAAAGCrTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCA 
CTCGCTCCCCCATTCCATCCTCCACCACTCCAAGCCCCTCTGCAAGAAGCAGCCCCGACC 
AAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATACGGTGTCCCCTGTGGGCC 
CCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGGCACGGAAG 
GTTrGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCT 
CGTACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCC 
TGAGCGCTGTGAGCAGCATGAATGGCATCAAC^CTTTGGCCTCTTCCCGAGGCTGTGCC 
CTGTCTACAGCAATCTCCTCGGTGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTT 
CTCTCCCGAGCTCGCTGCCCTCAGATGGAGCCCGGAGGTTGCTCCAGCCGGAGCATCCCA 
GGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTACCGGGGCCGCCGCCAGCA 
TGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGCCGCCACGG 
CAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACG 
AAGC CATG AAT CTCATTAAAAACAAAAGAAACATG AC CG G CT AC AAG AC C C TTC C C TAC C 
CGCTGAAG AAGCAG AAC GG C AAG ATCAAGTACG AAT G CAAC GTTTG C G C C AAG A C TTTCG 
GCCAGCTCTCCAATCTGAAGG TAGGCCTTGAGAGAGAGCAGTCCAAGGGGCTGTGAGTGC 
ATGCTTGTGTTTGTATTTAGCTTGCTTTCC^TGGGGT^ 

GAGCCCCCGGTTGGGGATAGTGGGTATGGATTCCGCCTGGCITTTGCCACTTCTAGCTCT 
TTGACTTTGGACAAGTGACTTCCCTTCTCCTGATTTTCTTCTGAATA^ 
GGGTTTGGACTAGAAGATTAGGTGAAACTCCCTGCTAGCCTGTGATTTTTGTGCTTTTAA 
GAAAAACACCATTCTGAAAACATGAAGATTTCTTCTTTTC 

CTTAAGATATTTGCATCAACACTTGAGTCTTGGAGCAGAAATCTTAGGTCTCAGAGC 

CTTGAGAGCAGAG CTAAC&CATCTGG CTTCTTCCCA GGTCCACCTGAGAGTGCACAGTGG 

AGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTCGCCCACCTGCA 

GAAACACTACCTGGTACACACGGGAGAAAAGCCACATGAATGCCAGG TGCGCAGTATTTT 

CTGGGTAGACCTTCTGACCTTTGTAGAAAATGTCTGTGAGTCACCCTCCCATCT 

TAGCCCGTAGTTAAAGCCAACACCAGATTCTGCGTTGTCCCATCCTGGACTGATGGCACT 

ATGGTCCCTCCCAGTACnTTGTATCTGCTX^TGACCTGAGATGGCACAGCCAGCTTCCAG 

TGGGTGGGAAAATGGTAGGGGAAATAAACAGCCCCTCGTGTGCTGTGTGCCCACATCCCC 

GGGCGTTtMCCGGTAAGCCTCCCCCTCCCGTTCGGAACTCTTAATCTTC 
TOTggOTTPCCTGCTTGTCTCTCTCCC CTACACTGTA GGTCTG CCACAAG AG ATTTAGCAG 
CACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTCTGCACCTGAAACT 

CCGGGAGCGGCCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCT 
CAAGGTTCACCTGAAAGGGAACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTT 
TCTGACCCGAATCAATCAAGAAATCGAGAAGTTTCACATCAGTGACAATCCTGACCGGCT 
OGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTGGAGAAGGAAATTCTGGCCGT 
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GGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAAACATGGGGAA 
TGGACTCCTCTCCTCAGGGTGCAGCC1"1TATGAGTCATCAGATCTACCCCTCATGAAGTT 
GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGAAACAGTTGAACC 
AATGGATCCTTAAGATTTTCAGAAAACACTTA lTl T GTTrCTTAAGTTATGACTTGGTGA 
GTCAGGGTGCCTGTAGGAAGTGGCTTGTACATAATCCCAGCTCTGCAAAGCTCTCTCGAC 
AGCAAATGGTTTCCCCTCACCTCTGGAATTAAAGAAGGAACTCCZAAAGTTACTGAAATCT 
CAGGGCATGAACAAGGCAAAGGCCATATATATATATATATATATATCTGTATACATATTA 
TATATACTTATTTACACCTGTGTCTATATATTTGCCCCTGTGTATTTTGAATATTTGTGT 
GGACATGTTTGCATAGCCrTCCCATTACTAAGACTATTACCTAGTCATAATTATTTTTTC 
AATGATAATCCTTCATAATTTATTATACAATTTATCATTC^^ 

GTTTACAATGACTGGAAAGATTCCTTGTAATTTGAGTATAAATGTATTTTTGTCTTGTGG 
CCATTCTTTGTAGATAATTT CTG CACATCTGTATAAGTACCTAAG ATTTAG TTAAACAAA 
TATATGACTTCAGTCAACCTCTCTCTCTAATAATGGTTTGAAAATGAGGTTTGGGTAATT 
GCCAATGTTGGACAGTTGATGTGTTCATTCCTGGGATCCTATCATTTGAACAGCATTGTA 
CATAACTTGGGGGTATGTGTGCAGGATTACCCAAGAATAACTTAAGTAGAAGAAACAAGA 
AAGGGAATCTTGTATATTTTTGTTGATAGTTCATGTTTTTCCCCCAGCCACAATTTTACC 
GGAAGGGTGACAGGAAGGCTTTACCAACCTGTCTCTCCCTCCAAAAGAGCAGAATCCTCC 
CACCGCCCTGCCCTCCCCACCGAGTCCTGTGGCCATTCAGAGCGGCCACATGACTTTTGC 
ATCCATTGTATTAT CAG AAAATGTGAAGAAGAAAAAAATG CCATGTTTTAAAAC CACTGC 
GAAAATTTCCCCAAAGCATAGGTGGCTTTGTGTGTGTGCGATTTGGGGGCTTGAGTCTGG 
GTGGTGTTTTGTTGTTGGTTTTTGTTGCTTTTTTTTTT^ 

TGCACAAACATGGTGCTCTACCAGGAAGGATTCGAGGTAGATAGGCTCAGGCCACACTTT 
AAAAACAAACACACAAACAACAAAAAACGGGTATTCTAGTCATCTTGGGGTAAAAGCGGG 
TAATGAACATTCCTATCCCCAACACATCAATTGTATTTTTTCTGTAAAACTCA.GATTTTC 
CTCAGTATTTGTGTTTTTACATTTTATGGTTAATTTAATGGAAGATGAAAGGGCATTGCA 
AAGTTGTTCAACAACAGTTACCTCATTGAGTGTGTCCAGTAGTGCAGGAAATGATGTCTT 
ATCTAATGATTTGCTTCTCTAGAGGAGAAACCGAGTAAATGTGCTCCAGCAAGATAGACT 
TTGTGTTATTCTATCTTTTATTCTGCTAAGCCCAAAGATTACATGTTGGTGTTCAAAGTG 
TAGCAAAAAATGATGTATATTTATAAATCTATTTATACCACTATATCATATGTATATATA 
TTTATAACCACTTAAATTGTGAGCCAAGCCATGTAAAAGATCTACTTTTTCTAAGGGCAA 
AAAAAAAAAAAAAAAAAAAAGAACACTCCTTTCTGAGACTTTGCTTAATACTTGGTGACC 
TCACAATCACGTCGGTATGATTGGGCACCCTTGCCTACTGTAAGAGACCCTAAAACCTTG 
GTGCAGTGGTGGGGACCACAAAACAACCAGGGAGGAAGAGATACATCATTTTTTAGTATT 
AAGGACCATCTAAGACAGCTCTATTTTTTTTTTGCCACTTTATGATTATGTGGTCACACC 
CAAGTCACAGAAATAAAAAACTGACTTTACCGCTGCAATTTTTCTGTTTTCCTCCTTACT 
AAATACTGATACATTACTCCAATCTATTTTATAATTATATTTGACATTTTGTTCACATCA 
ACTAATGTTCACCTGTAGAAGAGAACAAATTTCGAATAATCCAGGGAAACCCAAGAGCCT 
TACTGGTCTTCTGTAACTTCCAAGACTGACAGCTTTTTATGTATCAGTGTTTGATAAACA 
CAGTCCTTAACTGAAGGTAAACCAAAGCATCACGTTGACATTAGACCAAATACTTrTGAT 
TCCCJUlCTACTCGTTTGTTCT , l u lTrCTCCTTTTGTGCTTTCCCATAGTGAGAATTTTTAT 
AAAGACTTCTTGCTTCTCTCACCATCCATCCTTCTCTTTTCTGCCTCTTACATGTGAATG 
TTGAGCCCACAATCAACAGTGGTTTTATTTTTTCCTCTACTCAAAGTTAAAACTGACCAA 
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GTCTGGACTTGTGGTGCGCTGCCAGGGATCCGCAGCGTTGCCGGTTGTATTCGCTGGATACCAGAGGGCG 
GAAGTGCAGCAGGGTTCAGCTCCGACCTCCGCGCCGGTGClTriTGCGGCTGCGCGGGCTTCCTGGAGTC 

ctgctaccgcgtccccgcaggacagtgtgtcaggcgggcagcttgccccgccgccccaccggagcgcgga 

atctgggcgtccccaccagtgcggggagccggaaggaggagccatagci^ggagtaggtttggctttggt 

tgaaataagaatttagcctgtatgtactgctttaactcctggaagaatgacagatgacaaagatgtgctt 

cgagatgtgtggtttggacgaattccaacttgtttcacgctatatcaggatgagataactgaaagggaag 

cagaaccatactatttgcttttgccaagagtaagttatttgacgttggtaactgacaaagt 

cttt cag aagg tt atgagac aag aag acatt ag t g ag atatg g ttt g aat atg aag gc ac ac c ac tg aaa 

tggcattatccaattggtttgctatttgatcttcttgcatcaagttcagctcttccttggaacat^ 

tacatttt aag ag tttt c cag aaaaagac ctt ctg c actg t c cat ct aagg atg caattg aag ct cattt 

tatgtgatgtatgaaagaagctgatgctttaaaacataaaagtcm 

gatcacaag caactctggatgggattgcaaaatgacagatttgac cagttttgggc catcaatcggaaac 
tcatggaatatcctgcagaagaaaatggatttcgttatatcccctttagaatatatcagacaacgactga 
aagacctttcattcagaagcrgtttcgtcctgtggctgcagatggacagttgcacacactaggagatctc 
ctcaaagaagtttgtccttctgctattgatcctgaagatggggaaaaaaagaatcaagtgatgattcatg 
gaattgagccaatgttggaaac^cctctgcagtggctgagtgaacatctgagctacccggataattttct 
tcatattagtatcatc ccacagc caacagattgaaggatcaactatttg cctg aac agaatcatc cttaa 
atgggatttatc agag catgt cacccttttg cttcaatcaggtttggtggagg caac ctg accag aaac a 

CTTCGCTGCTGCAAGCCAGACAGGAAAAAGATTCCATGTCAGATAAGGCAACTGGGCTGGTC^ 

CATCACCTCTGCTTTCCTCCACTGCCATCATTAAACCTCAGCrrGTGACATGAAAGACTTACCGGACCACT 

GAAGGTCTTCTGTAAAATATAATGAAGCTGAAAC CTTTGGC CTAAGAAGAAAATGG AAGT ATGTG C CACT 

CGATTTGTATTTCTGATTAACAAATAAACAGGGGTATTTCCTAAGGTGACCATGGTTGAAC 

TGAAAGTGGAAACATTGGTTTAATTTTCAAGAGAATTAAGAAAGTAAAAGAGAAAT 

CTTCCAAGTAATTTTTTGTAAAAGATTGAATTAC^ 

TTTACAGTCTGTCTATTGGTATOCAATCTTGTAACTTTGATAATGAACAGTGAGAGA 
CCTCTAAATATGTTTTGTCATCTAATAA(^TACAGTTTTGTCA 

mGTAGATCACTTTTTACTCTGTGTTACCATTTTGACTGGTCGTCATTGGCATGGGGTG^ 
TAGGATTACTTGTCTCAGAAGCTGTCATAGAATTTCTTGCTGCCAAT^ 

ACTACACGTATAAATATTGTAACTGTTCAT CTTTGTTGTTTTATCACTGTAAGC CTGTCAAATCATAGTA 

TCCTAAGCATCTGTAAATGCTAATTTTGCATTTTTGGAAAAACCCATTCCTTCCA^ 

TTX^CTCCAGGTCTAATTITTCACTGTGGTCCCTGGCAGCCAGTCTTTTGAAGTTTAAAGATTA 

TCTTGACTGCAGTACCTTTTCTTTAATTTTTACCAAAAATATCCAGAGGT^ 

ATAAGGAAAGTTTGCTGCACTTTATTACCAAGCCTCTGGGATTTTACCAGTCAAA 

CATTTCATTTCTTGTGAGCTAGCTGGCTGTCCATATTGAATGTTGACCCATTT^ 

TACAGTATCAGACACGATCATGGTTTTAGATCCGATAAT^ 

ACAAATGCTGAAGTGAGATTCTACTATTGTTCIATTGCTTCCTTI^ 

AT/TAATAGCACATTTCTTCACAAAATTAGATAAAGTTGGTCA^ 

TAAAGCTTAATCAAAAAGAATAGCCAGTACAGCATACAATCTCAG 

TTGGTTGATGTAAACGAAAGTGCCATTITAGTAAAGGCAGGAAAAAAATAGCAATA 

GGATAAAAAATCCACTGACTIXjTATTTTTGCACAAGAGGCTGGTCT 

TCTTTACTCGTCGGTTCATmGGGGATTTTCCCCCTTGA 

AGCAAAAGGATCAGAATGCAGGGAA»CTAAGCTGTGATGAAGAAAGTGTGGTAAAAAGC»GAGTAGTT 
TTATACAGACAAAACCAGTGT»GGCCTTTGCAGTAGGCTTGAGTGAACTTCTG^ 

AAAl"l"l"rATGAAGACATTGCC CA1"1"1"1'TACTTCCTCATTCATTATTGTAC CAGCATCATAGCTTTATTAC 

T^TAATCCCAGGTAAGTCAAGCCTACAATGCCCTAGAGGAAGAGTAAAACCAGAAATTGATGCTGGCTTA 

AATAATCTATITTTGTTTCTTTTCATTrcAATATTTAAA 

AGAAAAAAAAAAAAAAAAAAAA 
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GAATTCCGGGAAGCCAGACGGTTAACACAGACAAAGTGCTGCCGTGACACTCGGCCCTCCAGTGTTGCGG 

AGAGGCAAGAGCAGCGACCGCGCACCTGTCCGCCCGGAGCTGGGACGCGCGCCCGGGCGGCCGGACGAAG 

CGAGGAGGGACCGCCGAGGCTGCCCCCAAGTGTAACTCCAGCACTGTGAGGTTTCAGGGATTGGCAGAGG 

GGACCAAGGGGACATGAAAATGGACATGGAGGATGCGGATATGACTCTGTGGACAGAGGCTGAGTTTGAA 

GAGAAGTGTACATACATTGTCAACGACCACCCCTGGGATTCTGGTGCTGATGGCGGTACTTCGGTTCAGG 

CGGAGGCATCCTTACCAAGGAATCTG C T TTT CAAGT ATGCCACCAACAG TG AAG AGGTT ATTGG AGTG AT 

G AGTAAAGAATACATACCAAAGGGC ACACG TTTTGG ACCCCTAAT AGGTGAAATCT ACAC CAATG ACACA 

GTTCCTAAGAACGCCAACAGGAAATATTTTTGGAGGATCTATTCCAGAGGGGAGCTTCACCACTTCATTG 

ACGGCTTTAATGAAGAGAAAAGCAACTGGATGCGCTATGTGAATCCAGCACACTCTCCCCGGGAGCAAAA 

CCTGGCTG CGTG TCAG AACGGGATGAAC ATCTACTTCTACACCATT AAG CCCATCC CTG C CAACC AGG AA 

L " rrcri 'GTGTGGTATTGTCGGG ACTTTGCAG AAAGG CTTC ACTACCCTTATC CCGG AGAG CTG AC AATG A 

TGAATCTCACACAAACACAG AGCAGTCTAAAGCAACCGAG C ACTGAGAAAAATGAACTCTG CCCAAAG AA 

TGTCCCAAAG AG AGAGT ACAGCGTGAAAGAAATCCT AAAATTGG ACTC C AAC C CCTCCAAAGG AAAGG AC 

CTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAAGACGTGGGAGCC 

CCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTCTGCCAGAAGACITTTTGAAAG^ 

TTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCACTCGCTCCCCCATTCCATCCTCCACCACTCCA 

AGCCCCTCTGCAAGAAGCAGCCCCGACCAAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATA 

CGGTGTCCCCTGTGGGCCCCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGG 

CACGGAAGGTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCrCCCGCCAGCTTTCATCCCCTCG 

TACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCCTGAGCGCTGTGA 

GCAGCATGAATGGCATCAACAACTTTGGCCTOTTCCCGAGGCTGTGCCCTGTCTACAGCAATCTCCTCGG 

TGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTTCTCTCCCGAGCTCGCTGCCCTCAGATGGAGCC 

CGGAGGTTGCTCCAGCCGGAGCATCCCAGGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTA 

CCGGGGCCGCCGCCAGCATGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGC 

CGCCACGGCAG AACATGTGGTGCAGCCCAAAGCTACCTC AGCAGCG ATGG C AGCCCC C AG CAG CG ACG AA 

G CCATG AATCTCATTAAAAAC AAAAGAAACATGACCGGCTAC AAGAC C CTTC CCT AC C CG CTG AAGAAG C 

AGAACGGCAAG ATCAAGTACGAATGCAACGTTTGCG CCAAG ACTTTCGGC C AGCTCTC CAATCTGAAGGT 

CCACCTGAGAGTGCACAGTGGAGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGOT 

GCCCAC CTGCAG AAACACTACCTGGTACACACGGGAG AAAAGCC ACATG AATGC C AGGTCTG C CACAAGA 

GATTTAGCAGCACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 

GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACACCCGGGAGCGG 

CCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCTCAAGGTTCACCTGAAAGGGA 

ACTGCGCTGCGGCCCCGGCGCOTGGGCTGCCCTTGGAAGATCTGACCCGAATCAATGAAGAAATCGAGAA 

GTTTGACATCAGTGACAATGCTGACCGGCTCGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTG 

GAGAAGGAAATTCTGGCCGTGGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAA 

ACATGGGGAATGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCT 

GCCTCCCAGCAACCCACTACCTCK^TACCTGTAAAGGTCAAACAAGAAACAGTTGAACCAATGGATCCT 

TAAGATTTTCAGAAAACACTTATTT 
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CGCCGCCTGTGCAGCCGCTGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCTGCC 
GCCCCGGCTGCCGCGCCGCGCCGCTGCCTCTGCCCCGGCCGCCCCCGCCGCCGCTGCCGCCGCCGGCCCG 
CAGCCAGCCAGGCGGGCGGCCCAGCCCGCCTGAGCCCGCAGCGGCTGCCGCCGCAGCGTCGGGTCGCTGG 
GTGCGCGGGCTACCGCGGACCGAGCGGACCCGAGTGGGCGACCAGGCGCTTGCCCGCCCAGTGCCACTGC 
CGCCGCTTCCTCGCCGGAGCACAGGACCAGACACCTCCAGCGCCCGCTGCTGCTGCCGATGCGGCCCGGA 
CACTTTTAGCTGGGCGGGAGGGCTGGAGAGCCGGGGGCCGCCGAGAACCGCCAGCGAGCTGTGCCGAGAG 
CCGCGCCGACCCGCTGCGATCAGGGACAGGCGCCCGCCCGCCGCCGCCGCCTGGCCGCT ATGGATCTATT 
CGACTTTTTCAG AGACTGGGACTTGG AGCAG C AG TG TC ACTATG AAC AAG ACCGTAGTGC ACTTAAAAAA 
AGGG AATGGGAG CGGAGGAATC AAG AAGTCC AG CAAG AAG ACG AT CTCTTTTCTTC AGGCTTTGATCTTT 
TTGGGGAGCCATACAAGGTAGCTGAATATACAAACAARGGTGATGCACTTGCCAACCGAGTCCAGAACAC 
GCTTGGAAACTATGATOAAATGAAGAATTTGCTAACTAACCATTCTAATCAGAATCACCTAGTGGGAAOT 
CCAAAGAATTCTGTGCC CCAG AATCC CAACAACAAAAATGAACCAAG CTfTT'ri'CCAGAAC AAAAGAACA 
GAATAATTCCAC CTCAC CAGG ATAATACCCATCCTTCAGC AC CAATG C CTC C AC CTTCTGTTGTG ATACT 
GAATTCAACTCTAATACACAGCAAC AG AAAATC AAAACCTG AGTGG TC ACGTG ATAGTCATAAC C CT AGC 
ACTGTACTGGCAAGCCAGGCCAGTGGTCAGCCAAACAAGATGCAGACTTTGACACAGGACCAGTCTCAAG 
CCAAACTGGAAGACTTCTTTGTCTACCCAGCTGAACAGCCCCAGATTGGAGAAGTTGAAGAGTCAAACCC 
ATCTGCAAAGGAAG AC AGTAACCCTAATT CTAGTGG AG AAG ATG CTTTC AAAGAAATCTTTC AATCCAAT 
TCACCGGAAGAATCTGAATTCGCCGTG CAAG CGCCTGGGTCTCCCCTAGTGGCTTCCTCTTTATTAG CTC 
CTAGCAGTGGCCTTTCAGTTCAAAACTTCCCACCAGGGCTTTACTGCAAAACAAGCATGGGGCAGCAAAA 
GCCAACTGCATACGTCAGACCCATGGATGGCCAGGACCAGGCACCGGACATCTCACCAACACTGAAACCT 
TC AATTG AATTTGAGAACAGCTTTGGG AATCTGTC&TTTGG AAC ACT CTTGG ATGG AAAAC C C AG TGC AG 
CCAGTTCAAAGACTAAACTGCC AAAGTTC ACCATC CTCCAAAC AAGTG AAG TAAG C CTTCC CAGTGAT C C 
AAGCTGTGTTGAAGAAATCTTGCGGGAGATGACCCATTCCTGGCCTACTCCTCTCACTTCCATGCATACT 
GCTGGACACTCTGAGCAGAGCACCTTTTCCATCCCAGGACAGGAATCGCAGCATCTGACCCCAGGATTCA 
C CTTACAAAAGTGGAATGACC CAACCACCAGAGCTTCTACAAAGTC AGTGTCTTTC AAATCGATG CTTGA 
GGATCACCTGAAGCTGAGCAGTGATGAAGATGACCTTGAGCCTGTGAAGACCTTGACCACT(^GTGCACT 
GCCACTGAGCTCTACCAGGCTGTTGAAAAGGCAAAACCTAGGAATAATCCTC 

CTCCCCAGCCCCCACCTGCAGTGCAAGCCAGCGGGGGTTCTGGCAGCTCCAGCGAATCGGAGAGCAGCTC 

TGAGTCGGATTCAGACACTGAAAGTAGCACCACTGACAGCGAATCTAATGAGGCACCTCGTGTGGCAACT 

CCAGAGCCTGAGCCACCCTCAACCAACAAGTGGCAACTGGATAAATGGCTTAACAAAGT^ 

ACAAGT CriT T A TTTGTGGCCCAAATGAAACACCCATGGAGACTATTTCTCTGCCTCCTCCAATCATCCA 

ACCAATGGAAGTCCAGATGAAAGTGAAGACGAATGCCAGTCAGGTCCCAGCTGAACCCAAAGAAAGGCCT 

CTCCTCAGTCTCATTAGGGAGAAAGCCCGTCCACGGCCCACTCAGAAAATTCCAGAAACAAAGGCTTTGA 

AGCATAAGTTGTCAACAACTAGTGAGACAGTGTCTCAAAGGACAATTGGGAAAAAACAGCCCAAAAAAGT 

TGAGAAGAACACCAGCACTGACGAGTTTACCTGGCCCAAACCAAATATTACCAGCAGCACTCCCAAAGAA 

AAAGAAAGTGTGGAGCTTCATGACCCACCAAGAGGCCGCAACAAAGCCACTGCCC^ 

GGAAAGAACCAAGACCTAACATCCCTTTGGCTCCCGAGAAGAAGAAGTACAGAGGGCCTGGCAAGATTGT 

GCCAAAGTOTCGGGAATTCATTGAAACAGATTCATCTACATCTGACTCCAACACAGAT 

CTGCAAATCAAAGTCCTGCCTCCGTGCATTATTTCTGGAGGTAATACTGCC 

GTCCCAGCCTGACCCTCAGCACCTTAATGAGTAGCAGTGGCAGCAACAACAA 

AGAGCCAACATTTTCACCTATTCCTGTCATGCAAACTGAAATCCTGTCCCCTCTGCGAGATCATGAGAAC 

CTGAAAAACCTCTGGGTGAAGATTGACCTTGACTTACTCTCTAGAGTAC 

CAGCACCTGCCAAGCCAGACGACAAGGAGACTGCCACAAAACCCAAGCGTCAGACAGCTC 

GGAG AAAC CAG C C CCTAAGGG CAAACGTAAG CAC AAGCCAATAG AAGTTGC AG AG AAG AT CC CTG AGAAG 

AAGCAGCGCCTGGAGGAGGCCAC^CTATCTGCT^ 

AGCCTCCCAACACTAGAGAAAATAATTCATCCAGGAGAGCAAATAGAAGAAAG^ 

TCCTCCACTTTCCCCACTGCCAGAGGACCCTCCACGCCGCAGAAATGTCAGTGGCAATAATGGTCCCT 

GGTCAAGACAAAAACATCGCCATGACTGGACAAATCACATCTACCAAACCTAAGAGAA 

TCTGTGCTACrrTCAAAGGGATATCGGTAAATGAGGGAGACACT 

CACTGTCACCAATACTGCTATTGCCACTGCTACTGTCACTCCTACT^ 
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GCTACTGCCACCGCCACGGCCACCACCACAACTACTACCACTACCA 

CTACTGGCCTCATGGATAGCAGTCACCTGGAGATGACGTCCTGGGCGGCTCTGCCCCTTCTATCCAGCAG 

CAGCACTAATGTCCGGAGACCCAAGCTCACTTTTGATGACTCGGTTCACAATGCTGATTATTACA 

G AAG CTAAG AAG CTG AAGCACAAAG CTG ATG CACTG TTCGAG AAATTTGG C AAAG CTGTG AATTATG CTG 

ATGCCGCCCTCTCCITCACTGAATGTGGCAATGCCATGGAACGCGACCCTCTGGAAGCAAA 

(^CCATGTACTCTGAGACTGTGGAGCTCCTCAGGTATGCAATGAGGCTGAAG 

GCTTCGGATGGGGACAAAAAGCTAGCAGTACTATGCTACCGATGTTTATCACTCCTCTA 

TTAAGCTGAAG AAGG AC CATG CT ATG AAGT ACT CCAG ATC ACTGATGGAAT ATTTT AAG C AAAATGCTT C 

AAAAGTCGCACAGATACCCTCTCCATGGGTAAGCAATGGAAAGAACACTCCATCCCCAGTGTCTCTCAAC 

AACGTCTCCCCC ATCAACGCAATGGGG AACTGTAAC AATGG CCCAGTCACCATTCCCCAG CGCATTCACC 

ACATGGCTGCCAGCCACGTCAACATCACTAGCAATGTCTTACGGGGCTATGAACACTGGGATATGGCCGA 

CAAACTG ACAAG AGAAAACAAAGAATTCTTTGGTG ATCTGGAC ACG CTG ATGGGGC CAC 

AGCAGCATGACCAATCTTGTC CG CTACGTTCG CCAAGGACTGTGTTGG CTG CGCATCGATGCCCACTTGT 

^TAGTGGGTGTTCTCAGATCTCTAGC^TCACGACCCATCACTCTACCTCTACCAGCGCACTGATGGTCA 

CTGGTGGAACTCCACTCACTGGGGAACGTTCTCTTTGGTTATGTTTGTTT 

GTAAAAAAGAGAAGTCATTGTAAGTTGACACTACAACTTAAGGG^ 

TTTTTTTCTTTTAGCATTTGATATGCATTTCTCAG 

T C CCTACAAT ATTGTTTT AAG C C CACACTAC C CAAAACAAAGAATGGG AAG CACTTG TG AT AAAG ACAGG 
CTCCTGAGAAATGCAACAAGTGGTCITACATATACATGAGAACTTAGACACAAGGGACCATCCCC 
TCTACTCTTATACCCAG AAAAGAACATATTTCAGAATCTGT CAAACTTTTG TGTATCCCACAG ATTCAAT 
CTTOIGGTGAGAATTTTCATTGTCAAAACCCACTCGTTAGATC 

ATCAAG AAAAT AAATG AG CAT AGCAATGCT ACT CTTAAAAAGATG CTATG C CACACAAC C AGAG G ACTTT 

CTTGTTAGCATCCCTTTCCTGATTCCCTATTTTGTTAATTTTAATGATAAGAAGAAAGGGTGACATTTAT 

TTTGACAAGTTTTAGGCATCAGCrGGCATCAGTGTTTTTCAACTCCATTATTT 

CTGGGGTTCTCTGTGTGCAAAGCTGTCCTTTTGAAGAACAGTTTGGTTGATGCA 

ATGCTACACTCTAGACTTACAAGTGGGAGTTAAGAGAGGTCTGGAAAGTGT 

TCTGCCTCCTTTGCAACAAGAACATTTACACAGTTC^ 

TGTATTTTGCTCAAATCTATGGGAACAAAAGTCAAGGTATCACTACCT^ 

CTTCCTAGTGGCTTGAAAATCTGGACTTCCTCAATTATTATTC^CATTCT 

TTTCTACTTTCTTTTTTCTCTTATCTGTGTTTCCCTTTCCT 

TACAATTACTCCTTTTATTAAAGTCCATATTATTGTGAATCATTTCCATGAAAATTTC^ 

AAACTCTCTAAATAGTAGCTAACTTTTATTTTTrTAAAATGAGTCGTGGGGTAGTGCTTCACCTTGAGAT 

GCTTTGAAAGAGCCCTAAACATTGGGAACCATTCACCTAATTTGGAGACATTTCTCACra 

CCCCCTTATGATCCTTCACATTCATTTTATGTCCCTAAACATCACAATGTAAATATCATTTTTGATGTTC 

CAGCTC^CCAGAAGATTCTTACACTTGGGGTAAACACrrATCC^TGCATT 

GGTATATAATTCCATGTAGCCTTTAATATGCTGGGTTATCAAATTCTGTTCACTGAGTTA 

AATAATAGATATGCACATGAAAGATGCAAACTTGTGTGATTATTAAAGCC^ 

GAAACAGCAGGTGATGACTCTGCACTCTCATTGTCAAGGTTAGCT 

ACTTGAGCTGTGCTCTCGTCATCTTTGAGTTTAAGGCCTTTTGCT 

CAATGGCTGAAGCCATGTTGTTAATATGGCTGATGGGAGCATCCCTGCAGCTGAACCCAG 

GCTCCCACTGTGGTTGAGCTTTATGTTTACAGTCTGAG 

TGAAACCTGAAAGAATCTTTTCTGAGCCTCTTAAAAGAGGAAAATGATGATA^ 

ACCCAAGGTTGGTGTCACATATAAAAATTAAGCTGATGACTTTCCAGTGACTCAAGTTC 

TGGTTTACCAGGTAGAGTGCCTGGCTATTACTATATAAT^ 

CTAAACCACAATCCTAGACCATCATGGATTTAGGAGTAGATTCCT 

GACATTAGAATGTTGAGGCAGTTTCCCAGAGAAACAAGCATATTGCCT 

CI71GTTTCAGTGACTTGTTATATCTACTTACATACAACAGGGAGG 

TGACTGAGTGTAAAATATGTGCCAAGTCTGCAGCACAGTGACCA^ 

CACTTGATTATGTAGTAGACTCATTTATAAAGCAGCTTAGGAACT 

TTCCTATCCCTTGAGATAAGACATCTTTCAGTTTCATGATTAAGGATTGTTGCTGT^ 

GTTCATCACAGTGTAAATGGTGATGCGTGTCGTAGGTGTGCAGCTATTTGAG 

ATTCTGTCAAATGAATCTCTTCAGTATACCAGTTTGTGGGAGGGATATGAGACATGTGGA 
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AGATCGTGCCTCTAGATCTTGATGGAGGCTTGGTGAGACACACTTAAATAAGCACGTGGAGGTTAGAATA 

GAGGGCAGAGTAAAAGGAAGCTCCATCTGAGCAAGTACACCAAATGATCTCAGCCCTGCAACTTGACCCA 

GGTAGGGCCACCACTACGCCTTCACTTGTCACCCAAGCTCCAACCACAGAGAGTTTGA 

ATGATGTTGGCTTGGCTTTGTATTTTTAATTAACTTTG 

AGTTTGGTAGGTAGGATTACTTTGAAAAGGGTTTACTAGTGTGGTCCTC 

ATGTTGTTAGCCAGCCTGTAGACTGTTAATTACTTAATAATCTCATTGGGAAAATA^ 

TTTGGATGACATAATTGGAAAAAGCAGATTAGCTGCTACTACT^ 

TTTTTTCCATGTAAGGAAATGAAAAGACCCAAAATCTT 

ATTGGCTAAAAATGTGTTTTGTTGAGTTTCCAAATGGATGAATTCT 

TCATTAGATTTTGTCTGCATTGGAAAGATACTCTTCTAGCATATCTTTCCCAAAGATATCTAA 

TCTGTTTCATGCAAATTTGCATCCCGGAGGTTGAAG TTGGAGTTTGAGGTTGGAAAATAT CTTTG AAGG C 

AGAATCAGTTGAGTTGTGAGGGTGAAGCCTCACATACTTCTCAACAGACATGATAAAATTCACCTGCATG 

AGTTGGCAGGTGGGAGAACCAAACTGGATCACTGGGTAAGACTACTCAGTAAAGCAATGA^ 

TAGAGAAGCATCACTATCCCCATTGAGAAAAATGTGTGGCAAGATGATACAGCTACACAGTATCAAATGA 

ATGGGTCAATTCAGCACCCCCAAATTTAATTCTGTGGGGAA 

ACGGCCTTATTCTCATAATTAAAATCTAATTCATTTTCTCTTTAGTGTTAGTA 

TGG CATCTGTGTATTCATAATCAG CATTTAC CCTGGCAGGAGACTAATCAGATAGGC CGGTCTCAGACAT 

TAATCCTACCATCTGATATTTTTGGTGAAGGAAAAAGTATTAATTCTCTTTCCATCCTCCTCCTCAGAAA 

TATAGAAGCCCTCTTTACCAAAATCATCACATTTTACTCTGTAATCTACCAGCTAAAAGAAAATTGCATT 

GAAGCCCCACAAAGCCAGATTGCAGTTCTTGCCCCTTTTTGCGTCTGACATGA 

CATTGTGCTCACATTGGGTTAGGGGACACTGAACTGCTTTTTAGATCCATGATC^ 

AGAGATTGGAGCTTTGCTGTTTCATTAACTGTGCAGTGTAGACTAATGGTGTTTAATAAAAATCATTCAA 
AATTTCAAACTCTTTTGCCAGTGACCTCAATTTTGTTGGCTCTGTC 

AAGGGGG AAGTGAAGGAAGCCTACGTCCAGGCCCCTGACAGGATGCTGCAGTAGCAAGCTCAAGCTCGCC 

TGCCTGCCAGCAGTTGCTGGTGAGCAGCAGCATGCAGACCAGCTGTGGGAAGCCTCCT 

AGCTGATGCTTTCAGCTGGGAATAGTTTGTTCCTATTGGGGAACTCATTGTTCTCCAGTCTCT 

GAAGCCAGCTGTCATATTCGGAGGGAATTTCAGATGCTTTAC CT TT T TGGTTTTGTCCTG 

GTGGCTACGAAAGTGTCTCTGAGAATAGAGCCCAATGTGGTGACAATGGGTAGTCAAATGCACCCCAGAT 

GCTCAAGCCCTGTTGTGGTTCTGCAGTGTTTATGAAATTGGGAGGAAGGAGAC^ 

ATTGGAGACACTCCAACGAGGCTAAGTTAATGCCGTGTTGCCCAGAACAAGATCTAGCTTCTCATTTGGT 

CAGCCTAGCATGCAACCAGTGGTGTGCTGGTAAAATGTTTAACAACCAGCTCGCTGAGAATAGAAAGCAC 

CTGGTTTGCACCATTTGCCAATTTCCATGGCATAAATACTACCACTTTAGATGATTTTAAGCTA 

GTGATGTCACTGAAC^CATGGTTGGAAAGAGATGCACGCAGTTGGCTCTTGCAAGCC^ 

TTCAAGACGCCACTGGATGCAGCCAGTCAGAGGGTTCATATTTAATATATGTGTTCA 

AGACACACACACACAAACTCACCCTTACACACACACTT^ 

ATGAATCAATGTGTGAATGTAGAAAGCTTATGATAAGGCCCTAGAGGTATGGGTTGCCCTGGAAGCCTAG 

GTTTTAAGCAGGAGAATAGCTGAGAAGAATGAAGCCCTCCTGAGCTGAAAGGA^ 

ATGGTTCCATCATCTCCTTCCATATCTCACAGGTAAAA 

TTAAAAAGATAAGTGAGTGTTTTTTATTTTATTATTAT^ 

TGTAACTTTTACATGTAACTAGGATAAAGTATTTACGGGA^ 

TACTGTGTTTTTCTTTTATGTGACGTGGAAACTCAGTAATTCTCCCACC 

ATTTTACTTTAGTTATTAGGGAATCTAAGTTTTTTGTTAACATTTGTTTTTAG 

CTGTTTTAGCTCTGAACTCAAACCAGAATATCTCTGTATC 

AAACOUUVATAATTCTTTTTCCACCCAGTACGAAGAAAACTAAGCTCACT 

AGTATATAATGAGGCTTCCATTAAATACACACACACACACACT 

TTTTTAAATTAGGCCTCCACACATAAATCATTTTGAAAGTAGAATAGAAAATCT 

CTGGTCCTGTGCATCTTCTGCAGTTAATAAGAGGTTTGTATCTGGAAAGATGGAA 

TCTTATTTTTCAAAAAAAAATTTCGATTTTCTCTCT 

GGAGATCCATGTCTTACTCGCTCTTTCTGGCCCTTCTGTCTTTTGCCTCT 

CACGATAGCAGGGACTGGGGGTCTATCCTTTCATGGTATTGCTACAATATTTGTCCrrTACTG 

TAACATCCGGGTCTGATTTAATTGGCATTACACTTACACAGGGACTCTGAGCACCCCCGTCACCACA 
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GACAGTGGACCAGTTTTCACAGCTACAAAGAGCTAGAAATGTGTTTAACATCATCCA 
TTCAAAACCATCCTCACTAATCAATCA^ 

GACAATTTGTCAAATACTTAATTTTCTTCCTGGATGATTCTACTTACT 

TCTGAGATAAAATCCCTCACATTTACTCAATATAACAAATTACTGTTTCrrA 

TTCTGAAGATTGTTTGCTGTAGTGTTGTCTTTGATAAAATGAATGTCAGTAGTG^ 

CMGCTCAGACATCCTCTTTGGGATCAGAAGATACCTAAAA 

AGTGATATATTCTTTGGATCCTGCAAAGAAGAGATTGGTTTCTTTTCTTTTCTGG 

TATCTGTGGCTGTGATGGTTGTTGTTACTTGTCTCTCTCTCTCTCTGGCTCTGGCTTTTGCTT^ 

AGTGTTCTTTCTCTTTCCAAACAAATAGTTAAATTAAACGTGAGCTTCTGAATTG 

TCAAAACATAACAGATTAATAAAAATAGATGTGTCCTGATTTAAAACATGCCCCCTGGAAAGGCATG^ 

TATTATGAAATCGTGATAATATAACTGCATTATTACATGGCAGTATAAATATTAGTCTGTTGAATTCAT^ 

TGTCCAATTGTATAACTTTGTGGAGCAGTGTTTTGACCTTTGATACATAATTCTGGAGCAAGTGGA 

TTGCAGGCAGATGAGACAGTGTTATATCAGGATTTTTCAATCAACTTTAG 

AACATCTT CAG ATGTTT CTGT AAC CATT AT AAAT ATGAAAAAAAC C TCTTCAAAAAATTT C C C ATAGT AC 

TTCAGTCAAGACTTTTTAGGTTTATCTTTTTTTTTTCA 

GGGGGGG TTGTTATCATTGACTGAAGAAATATTTTGAT 

TCTCTCTCCTCTATTCTTTCCTCCTTCCCTCTGTCCATCACCCCTCATTAAAATATTGAAATCTGGAGTC 
TTTGATAAATCTGCATTAGACCAGGCTATATGCTAGGAATGAM^ 

AAGAATG CTC CATGTTC ATTG GGC C C TTT CA C AC C C CAC AG TGAT AAATGAAAAG G ATAG AGGT AGTTTT 
TT CAAAAGAG CA wrr T AAT AAT ATCC TCTGAG AC CT AATG CAGTTT AACAAATG AC T C CAC CT ATTTTT C 
CAGTAGGTAAATTGACTGAGACTTGCAAAATACCCCTGAGAGTO 
TAGCGTGTGTGTTTGCTTTGTATCTAACAGGCACATTCACGTCTC^ 

ACATTCCCATTAGCCTGTATATAAGAATCAGAAAGATAATCCCJUVCATGTTGTAAATGAAGATGTGACTC 
TATAACCTTTCTCTTCTTCCTGGAAAAAAAAGGACATTTTCATGCA 
TTTAAGTGTCATAGAAAATATTTATTGAGTAACTGGGACACAAATGGGAATT^ 
TTGTGTGTGGGGATGCTTACCAACACCATGTCGCTGGACCATTGTGG 

ACACATCGTCAGTGTGTGTGTGTGTGTGTGTGTGCGCGCACGCACGTGCGTGTGTGTGTCCCTGCATGTG 

CAACATGTCTAGCTTGCTGTCCTTCATGGGATTTTAGCTTrC^ 

CCAGGAGGCCCTGGTTACATTACTATATGAAGGCAGTGATTTC 

CTTTGGTCATAATATCATGGTTCAATTAAACGGATTCCACCGGACTTTGTGATGAAAAAC^ 

AATCCAATTGAGTTTCCAAGAGGAAATTGTAGTAGGTCAAGATGCATGAGAG 

CAGCTGGAGAACATGAGCTGAGTTGAGCCCTCAGTGTTGAAGTTGACTTGCTCCAAGC 

CCCTGGGGCCCGTGCCTGGCCTATGCTCCCTCCCAAGTAAGTAGAGGAGCAGAACCATCAGGAACAGCCT 

GCCTGGCTCCTATGAAGAAAACTTCCTGACGTCCTGTCCCCAAAGGAAGACCCTTTCCCCAAGGGCACCC 

CAGGTGGCCATTAAATTGTGATGATCATTCAGAAAGTGCCCCCTTGGCTTTATGAGAATCCAATTAGTCT 

TCTGAACCACCTTTTCTTGGGTGCAGATTTCCAA^ 

TTCTTAACAAGCATGCTCGTCTTGTCAGAATTTCAGTAAGTTCC^ 

TGTTCTAAAATCAATCAATTAATGAAATGTTATCTGGTTCT 

ATAAAACTATATCTGCCTGTGTGGCTTTGCATTTCAA^ 

GTTCTCAGTACAGTAACTCTGTGTACAAACATrrrAATGTGGTTTTG 

GTAAAAATGATATTGGCTGAGCTGGTGCGTTGGTTTCT 

TTGAATTATTTAAAAATGCAAAATAAAATTTTTATGAAAATCTCA 



FIGURE 26.4 
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<210> 1 
<211> 2599 
<212> ADN 

<213> Homo sapiens 
<400> 1 

atcccctgcc ttaatcgcca agctccttca ggagaacaaa gaacaggcca ttaccctgga 60 
gaagactggc aactgatttt acccacaagc ccaaacctca gggatttcag tatctactag 120 
tctgggtaga tactttcacg ggttgggcag aggccttccc ctgtaggaca gaaaaggccc 180 
aagaggtaat aaaggcacta gttcatgaaa taattcccag attcggactt ccccgaggct 240 
tacagagtga caatagccct gctttccagg ccacagtaac ccagggagta tcccaggcgt 300 
taggtatacg atatcactta cactgcgcct gaaggccaca grcctcaggg aaggtcgaga 360 
aaatgaatga aacactcaaa ggacatctaa aaaagcaaac ccaggaaacc cacctcacat 4 20 
ggcctgctct gttgcctata gccttaaaaa gaatctgcaa ctttccccaa aaagcaggac 4 80 
ttagcccata cgaaatgctg tatggaaggc ccttcataac caatgacctt gtgcttgacc 54 0 
caagacagcc aacttagttg cagacatcac ctccttagcc aaatatcaac aagttcttaa 600 
aacattacaa ggaacctatc cctgagaaga gggaaaagaa ctattccacc cttgtgacat 660 
ggtattagtc aagtcccttc cctctaattc cccatcccta gatacatcct gggaaggacc 720 
ctacccagtc attttatcta ccccaactgc ggttaaagtg gctggagtgg agtcttggat 780 
acatcacact tgagtcaaat cctggatact gccaaaggaa cctgaaaatc caggagacaa 840 
cgctagctat tcctgtgaac ctctagagga tttgcgcctg ctcttcaaac aacaaccagg 900 
aggaaagtaa ctaaaatcat aaatccccat ggccctccct tatcatattt ttctctttac 960 
tgttctttta ccctctttca ctctcactgc accccctcca tgccgctgta tgaccagtag 1020 
ctccccttac caagagtttc tatggagaat gcagcgtccc ggaaatattg atgccccatc 1080 
gtataggagt ctttctaagg gaacccccac cttcactgcc cacacccata tgccccgcaa 1140 
ctgctatcac tctgccactc tttgcatgca tgcaaatact cattattgga caggaaaaat 1200 
gattaatcct agttgtcctg gaggacttgg agtcactgtc tgttggactt acttcaccca 1260 
aactggtatg tctgatgggg gtggagttca agatcaggca agagaaaaac atgtaaaaga 1320 
agtaatctcc caactcaccc gggtacatgg cacctctagc ccctacaaag gactagatct 1380 
ctcaaaacta catgaaaccc tccgtaccca tactcgcctg gtaagcctat ttaataccac 14 40 
cctcactggg ctccatgagg tctcggccca aaaccctact aactgttgga tatgcctccc 1500 
cctgaacttc aggccatatg tttcaatccc tgtacctgaa caatggaaca acttcagcac 1560 
agaaataaac accacttccg ttttagtagg acctcttgtt tccaatctgg aaataaccca 1620 
tacctcaaac ctcacctgtg taaaatttag caatactaca tacacaacca actcccaatg 1680 



WO 99/67395 



PCT/FR99/01513 



catcaggtgg gtaactcctc ccacacaaat 
ctgtgguacc tcagcctatc gttgtttgaa 
attcttagtg ccccctatga ccatctacac 
taagccccgc aacaaaagag tacccattct 
tgcactaggt actggcattg gcggtatcac 
tcaagaacta aatggggaca tggaacgggt 
acttaactcc ctagcagcag tagtccttca 
tgaaagaggg ggaacctgtt tatttttagg 
cggaatcgtc actgagaaag ttaaagaaat 
gcttcgaaac actggaccct ggggcctcct 
cttaggacct ctagcagcta taatattgct 
ccttgrtaac tttgtctctt ccagaatcga 
gcagtccaag actaagatct accgcagacc 
tgttaatgac atcaaaggca cccctcctga 
ccccaattca gcaggaagca gttagagcgg 
ttttcctgtt gagatgggg 



2 

agtctgccca cccrcaggaa tattttttcr 1740 
tggctcttca gaatciacgt gcttcctctc 1300 
tgaacaagat ttatacag-:- atgtcatazc 1860 
cccttttgtc acaggagcag gagtgciacc 1920 
aacctctact cagzzzzazz acaaactatr 1980 
cgccgactcc czqgzcaczz tgcaagatca 2040 
aaatcgaaga gcrtragac* tgctaaccgc 2100 
ggaagaatgc tgttattacg ttaatcaatc 2160 
tcgagatcga atacaacgta gagcagagga 2220 
cagccaatgg atgccrtgca ttctcccctt 2280 
actcctcttt ggaccctgta tctttaaccz 2340 
agctgraaaa Cuacaaatcg agcccaagat 2400 
cctggaccgg cccgctagcc cacgacctga 24 60 
ggaaatctca gctgcacaa- ctctactacg 2520 
tctcggccaa cctccccaac agcacttagg 2580 

2599 



<210> 2 
<211> 1326 
<212> ADN 

<213> Homo sapiens 
<400> 2 

gccgcctggc actcctgagg gaagtataaa 
ttgtagaaaa ggcaaatgga gtgaagtgcc 
caactcacaa ttatgtaaaa agtgtgattt 
tccctatccc agcatccccg actccttccc 
tggtccaaaa ggagatagac aaaagggtaa 
aattatgacc cctccaagca gtgggaggaa 
ctttttctct cccagactta aagcaaataa 
ctgatggcta tattgatgtt ttacaagggt 
atataatgtc actgctaaat cagacactaa 
cagcctgaga gtttggcgat ctctggtatc 
aggaaagaga atgattcccc acaggccagc 
acacagaatc agaacatgga gattggtgct 
gactaaggaa aactaggaag aagtctatga 
gaagggaaga aaatcctact gcctttctgg 
cctctctgtc acctgactct tctgaaggcc 
agtcagctgc agacattaga aaaaaacttc 
tagaaaccct attgaacttg gcaacctcgg 
cggaacagga caaacgggat taaaaaaaag 
gtggactttg gaggctctgg aaaagggaaa 
tgcttccagt gcggtctaca aggacacttt 
ccccctcgtc catgcccctt atttcaaggg 
caaaggtcct ctgagtcaga agccactaac 
ctgggg 



ttataacacc atcttacagc tagacctctt 60 
ataagtacaa actttcttt" cattaagaga 120 
atgccctaca ggaagccttc agagtctacc 180 
caactaataa ggacccccct tcaacccaaa 240 
acagtgaacc aaagagtgcc aatattcccc 300 
gagaattcgg cccagccaga gtgcatgtgc 360 
aaacagactt aggtaaattc tcagataacc 420 
taggacaatt ctttgatctg acatggagag 480 
ccccaaatga gagaagtgcc accataactg 540 
tcagtcaggt caatgatagg atgacaacag 600 
aggcagttcc cagtctagac cctcattggg 660 
gcagacattt gctaacttg^ gtgctagaag 720 
attactcaat ga^gtccacc ataacacagg 780 
agagactaag ggaggcattg aggaagcgrg 840 
aactaatctt aaagcgtaag tttatcactc 900 
aaaagtctgc cgtaggcccg gagcaaaact 960 
ttttttataa tagagatcag gaggagcagg 1020 
gccaccgctt tagtcatgac cctcaggcaa 1080 
agctgggcaa attgaatgcc taatagggct 1140 
aaaaaagatt gtccaagtag aagtaagccg 1200 
aatcactgga aggcccactg ccccagggga 1260 
cagatgatcc agcagcagga ctgagggtgc 1320 

1326 



<210> 3 
<211> 10499 
<212> ADN 

<213> Homo sapiens 
<400> 3 

ccctggggcg ggcttccttt ctgggatgag 
ttgcaactga gagacaggac tagctggatt 
gctgggaagg tgaccacgtc cacctttaaa 



ggcaaaacgc ctggagatac agcaattatc 60 
tcctaggccg actaagaarc cctaagccta 120 
cacggggctt gcaacttagc tcacacctga 180 
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ccaatcagag agctcactaa aatgctaatt 
atcatcnatt gcctgagagc acagcaggag 
tcgagctggc aacagcagcc cccctttggg 
tgctatttca crctattaaa tcttgcaacc 
cgagctgagc ttttgctcac cgcccaccac 
tgactcccat ccctctggat cctgcagggr 
ccattgccgc tcccaattgg gctaaaggct 
ggtttgttct aattgagctg aacactagtc 
acggcttcta atagaactat aacacttacc 
cgtgaggcca agaactccag gtcagagaat 
tgctaccatc ttggaagtgg ttcaccacca 
ggtaacattt tggcaaccac gaacggacat 
cacttgctat tctgtcctat ccttccctag 
ccagttaaaa acgattagtg tggccaccgg 
gaagggcttt ctaacaaccc ccaacccttc 
gcttccactt tcagttttct tggggaagcc 
cctgaactcc cggcagtagc cggttgagat 
ccatgcatgc acccctatct ttccttctga 
tcttcaaagt gtagccccaa aattctcctt 
ctcctaggta ctattggttc agacttccat 
tctaaggaag ctctgcgctg cgtccttagg 
cctggcgtcc ctcccaattt aggcatacag 
ctccccacca cccttgccag ggccccaagt 
aggagagaga gagaaatgga ggagaaagag 
gagagacaga agagagagag agacaaagag 
gagaaagaaa tagtaaaaaa cagtgtgccc 
acctgtactt gataattgaa ggtcttctct 
ggtcagtgta aataagagca taggccgaaa 
cctatcaaaa atccttaacc cagtaacccg 
gcaactgctt tgctaaaagt agaaaagtaa 
ctcacctgtt cagaattatt ctaataaaaa 
tcttaaagta tggggctatt ctgttagaaa 
cccttaaccc agcagatttc ctaacgggat 
ccagacctag gcggaactcc cttcaggaca 
aggaaaaaaa ccacaatggg tattcagtaa 
tagaaaaatt gcctaataac tggtctcctc 
ccttaaagta cttacagaat caaaagacta 
ccctctctgt aatgcatttg cataagaact 
ctgggttgtt ataaaatagg aacccagccc 
caatgttggg catgctggta aaggaccact 
tggtcaagaa aggcgggaaa aggggtgcag 
gataaacaga ggtccatggg tggttacgca 
aggcaatgtt gggcacgctg gtaaaggacc 
ttgtggtcaa gagaggcagg aaaacaggtg 
ttcgataagc agaggtccat gggtggtgat 
tagaggacac tccaggacta aagctcatcg 
gttctttttt cagatgggaa acgttccccg 
ggagaattgg gaccaatttg accctcagac 
cagtgccgcc tggcactcct gagggaagta 
tcttttgtag aaaaggcaaa tggagtgaag 
gagacaactc acaattatgt aaaaagtgtg 
tacctcccta tcccagcatc cccgactcct 
caaatggtcc aaaaggagat agacaaaagg 
ccccaattat gacccctcca agcagtggga 
gtgccttttt ctctcccaga cttaaagcaa 
aaccctgatg gctatattga tgttttacaa 
agagatataa tgtcactgct aaatcagaca 
actgcagcct gagagtttgg cgatctctgg 



aggcaaagac aggaggtaaa gaaatagcca 240 
ggacaacaat cgggatataa acccacgcat 300 
icccttccct ttgtatggga gctgttttca 360 
gcactcttct ggtccatgtt tcttacggct 420 
tgctgtttgc caccaccgca gacctgccgc 480 
gcccgctgtg ctcccgatcc agcgaggccc 540 
tgccattgtt cctgcacggc taagtgcctg 600 
actgggttcc acggttctct tctgtgaccc 660 
acatggccca agatrccatt ccttggaatc 720 
acgaggcttg ccaccatctr ggaagcggcc 780 
tcttgggagc tctgtgagca aggacccccc 840 
ccaaagtggt gagtaatatt ggaccactrt 900 
aattggagga aaataccggg cacttgtcgg 960 
acttaagact caggtgtgag gctatctggg 1020 
tgggctgggg acttggtttg cctcaagcca 1080 
gagggccgac cagaggcaga aagctgtcgt 114 0 
catggtgtag ccagaagtct caacagtcgc 1200 
cccatacctc ctgggtccca accacaactt 1260 
acctctgaat atacttcctc tgatccctgc 1320 
ttcctctagc aagttgcatc tccaaaggga 1380 
cacctaggct acaacccagg gagtcttatc 144 0 
ctcttgacat gggcagttat gtaggaccca 1500 
ttgtaaatgg ctgagggaaa agagagacag 1560 
agagagacag agaggagaga gagacagtga 1620 
gagagagaga gagtcaaaga gagaaagaaa 1680 
tatcccttta aaagccaggg taaatttaaa 1740 
gtgaccctat agcactccaa tccactttgt 1800 
gcactgaggc cattgacaac ccgtagcttc 1860 
cagatggacc aaatgcattc agtcggtagc 1920 
cttttagagg aaacctcatt gtgagcacac 1980 
aagcaaaaag gtagcttact aactcaaaaa 2040 
aaggtaatgt aactccaacc actgataatt 2100 
ttaaatctta attaccatac aaaggtccga 2160 
ggacgataga tggttcctcc caggtgattg 2220 
ttgatacggg gacrcttgtg gaagcagagt 2280 
aaacgtgtga gctgtttgca ctcagccaag 2340 
tctcaatcct gattcaaaag gttagctaca 2400 
tgtttatggg aatgcatctt gatggggcag 2460 
agctctagga ctcacccctg agcgcaaagg 2520 
agaatccagc agcccagacc cctttctttg 2580 
gactgctaca tcggtaagca taactaatcc 2640 
ccctggaaag gaactcaccc ctgagcacaa 2700 
actagaatcc agcagcctgg acccctttct 2760 
caggactgca acatcagtga gcataactaa 2820 
gcaccctgga aagaataagc attaggacca 2880 
gaaaatgact agggttgctg gcatccctat 294 0 
caagacaaaa acgcccctaa gacgtattct 3000 
actaagaaag aaacgactta tattcttctg 3060 
taaattataa caccatctta cagctagacc 3120 
tgccataagt acaaactttc ttttcattaa 3180 
atttatgccc tacaggaagc cttcagagtc 3240 
tccccaacta ataaggaccc cccttcaacc 3300 
gtaaacagtg aaccaaagag tgccaatatt 3360 
ggaagagaat tcggcccagc cagagtgcat 3420 
ataaaaacag acttaggtaa attctcagat 3480 
gggttaggac aattctttga tctgacatgg 3540 
ctaaccccaa atgagagaag tgccaccata 3600 
tatctcagtc aggtcaatga taggatgaca 3660 
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acagaggaaa gagaatgatt ccccacaggc 
tgggacacag aatcagaaca tggagattgg 
gaaggactaa ggaaaactag gaagaagtct 
cagggaaggg aagaaaatcc tactgccttt 
cgtgcccctc tgtcacctga ctcttctgaa 
actcagtcag ctgcagacat tagaaaaaaa 
aacttagaaa ccctattgaa cttggcaacc 
caggcggaac aggacaaacg ggattaaaaa 
gcaagtggac tttggaggcc ctggaaaagg 
ggcttgcttc cagtgcggtc tacaaggaca 
gccgccccct cgtccatgcc ccctatttca 
gggacaaagg tcctctgagt cagaagccac 
gtgcctgggg caagcgccat cccatgccat 
cattgagggc caggaggttg tctcctggac 
tgtcccggac aactgtcctc cagatctgtc 
cactagatac ttctcccagc cactaagtta 
ttttctaatt atgcttgaaa gccccactac 
aggggccatt atacacctga acataggaga 
ggaaggaatt aatcctgaag tctgggcaac 
ccgtcctgtt caagttaaac taaaggattc 
cctcagaccc aaggcccaac aaggactcca 
cctagtaaaa ccatgcagta acccctgcag 
cagacagtgg aggttagtgc aagatctcag 
gccagctgta cctagccctt atactctgct 
tacagtcctg gaccttcagg atgccttctt 
cttgtttgcc tttgaagata cttcaaaccc 
ccaagggttc agggatagtc cccatctatt 
atcctcatac ctggacactt gtccttcggt 
cagaaacctt gtgccatcaa gccacccaag 
acatggtttc caaaccaaag gctcaactct 
atccaaaggc accagggccc tcagtgagga 
tcccaaaacc ctaaagcaac taaggggatt 
gattcccagg tatggcgaaa tagccaggtc 
agccaatacc catttagtaa gatggacaac 
ccaagcccca gtgttaagtt tgccaacagg 
aacaggaata gctctaggag tccttacaca 
atacctgact aaggaaattg atgtagtggc 
ggtggcagta gcagtcttag tatctgaagc 
tgtgtggaca tctcatgatg tgaatggcat 
agacaactgt ttacttaaat gtcaggctct 
cacttgtgca actcttaacc cagccacatt 
taactgtcaa caagtaattt ctcaaaccta 
tttgactgat cccgacctca acttgtatac 
tcgaaaagtg gggtatgcag tggtcagtga 
tccaggaact agtgctcagc tagcagaact 
agaagaaaaa agggcaaata tatatacaga 
ccatgcagca atatggaaag aaagggaatt 
tcaggaagcc attaggaaat tattattggc 
acactgccgg ggtcatcaga aaggaaagga 
tattgaagcc aaaagagctg caaggcagga 
cctagtatag ggtaatcccc tccgggaaac 
atggggaacc tcacgaggac agttttctcc 
aaatactttt gcctgcaact atccaatgga 
acttaggcat cgatagcacc catcagatgg 
tcaaaactat caagcagata gtcagggcct 
cttatcgcca agctccttca ggagaacaaa 
aactgatttt acccacaagc ccaaacctca 
tactttcacg ggttgggcag aggccttccc 



cagcaggcag :ccccag:c: agaccctcat 3~20 
tgctgcagac atttgctaac ttgtgtgcra 3750 
atgaattact caatgargcc caccataaca 3840 
ctggagagac taagggacgc attgaggaag 3900 
ggccaactaa tcttaaagcg taagttta" 3960 
cttcaaaagr ctgccgtagg cccggagcaa 4020 
ccggtttttt ataacagaga tcaggaggag 4080 
aaaggccacc gctttagica tgaccctcag 4140 
gaaaagccgg gcaaattgaa tgcctaatag 4200 
ctttaaaaaa gattg^ccaa gtagaagcaa 4260 
agggaatcac tggaaggccc actgccccag 4320 
taaccagatg atccagcagc aggactgagg 4380 
caccctcaca gagccctggg tatgctrgac 44 4 0 
actggtgcgg tcttcttagr cttactct-c 4500 
actatctgag ggggtcctaa gacgggcagz 4560 
tgactgggga gctttactc* tttcacatgc 4620 
cttgttaggg agagacat-c tagcaaaagc 4680 
aggaacaccc gtttgttgtc ccctgctcga 4740 
agaaggacaa tatggacgag caaagaatgc 4800 
cacctccttt ccctaccaaa ggcagtaccc 48 60 
aaagattgtu aaggacctaa aagcccaagg 4 920 
tactccaatt ttaggagcac agaaacccaa 4930 
gattatcaat gaggctgttg rtcctctata 5040 
ttcccaaata ccagaggaag cagagtggrt 5100 
ctgcatccct gtacatcccg actctcaatu 5160 
aacatctcaa ctcacctgga ctattttacc 5220 
tggccaggca ttagcccaag acttgagcca 5280 
aggtggatga tttactttrg gccgcccatt: 5340 
cgctcttcaa tttcctcgct acctgtggct 5400 
gctcacagca ggttacttag ggctaaaatt 54 60 
acacatccag cctatactgg cttatcctca 5520 
ccttggcgta ataggtttct gccgaaaatg 5580 
attaaataca ctaattaagg aaactcagaa 5640 
tgaagtagaa gtggctttcc aggccctaac 5700 
gcaagacttt tcttcatatg tcacagaaaa 5760 
gatccgaggg atgagcttgc aacctg-ggc 5820 
aaagggttga cctcatrgtr tacgggtagr 5880 
agttaaaata atacagggaa gagatcttac 5940 
actcactgct aaaggagact tgtggctgtc 6000 
attacttgaa gggccagtgc tgcgactgtg 6060 
tcttccagac aatgaagaaa agataaaaca 6120 
tgccactcga ggggaccttt tagaggttcc 6180 
tgatggaagt tcctttgtag aaaaaggact 624 0 
taatggaata cttgaaagta atcccctcac 6300 
aatagccctc acttgggcac tagaattagg 6360 
ctctaaatat gcttacctag tcctccatgc 6420 
cctaacttct gagagaacac ctatcaaaca 64 80 
tgtacagaaa cctaaagagg tggcagtctt 654 0 
aagggaaata gaagagaact gccaagcaga 6600 
ccctccatta gaaatgctta taaaacaacc 6660 
caagccccag tactcagcag gagaaacaga 6720 
cctcgggacg gctagccact gaagaaggga 6780 
aattacttaa aacccttcat caaacctttc 6840 
ccaaatcatt atttactgga ccaggccttt 6900 
gtgaagtgtg ccagagaaat aatcccctgc 6960 
gaacaggcca ttaccctgga gaagactggc 7020 
gggatttcag tatctactag tctgggtaga 7080 
ctgtaggaca gaaaaggccc aagaggtaat 714 0 
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aaaggcacca gttcatgaaa taattcccag 
caatagccct gctttccagg ccacagtaac 
atatcactta cactgcgcct gaaggccaca 
aacactcaaa ggacatctaa aaaagcaaac 
gttgcctata gccttaaaaa gaatctgcaa 
cgaaatgctg tatggaaggc ccttcataac 
aacttagttg cagacatcac ctccttagcc 
ggaacctatc cctgagaaga gggaaaagaa 
aagtcccttc cctctaattc cccatcccta 
attttatcta ccccaactgc ggttaaagtg 
tgagtcaaat cctggatact gccaaaggaa 
tcctgtgaac ctctagagga tttgcgcctg 
ctaaaatcat aaatccccat ggccctccct 
ccctcctcca ctctcactgc accccctcca 
caagagtttc tatggagaat gcagcgtccc 
ctttctaagg gaacccccac cttcactgcc 
tctgccactc tttgcatgca tgcaaatact 
agttgtcctg gaggacttgg agtcactgtc 
tctgatgggg gtggagttca agatcaggca 
caactcaccc gggtacatgg cacctctagc 
catgaaaccc tccgtaccca tactcgcctg 
ctccatgagg tctcggccca aaaccctact 
aggccatatg tttcaatccc tgtacctgaa 
accacttccg ttttagtagg acctcttgtt 
ctcacctgtg taaaatttag caatactaca 
gtaactcctc ccacacaaat agtctgccta 
tcagcctatc gttgtttgaa tggctcttca 
ccccctatga ccatctacac tgaacaagat 
aacaaaagag tacccattct tccttttgtt 
actggcattg gcggtatcac aacctctact 
aatggggaca tggaacgggt cgccgactcc 
ctagcagcag tagtccttca aaatcgaaga 
ggaacctgtt tatttttagg ggaagaatgc 
actgagaaag ttaaagaaat tcgagatcga 
actggaccct ggggcctcct cagccaatgg 
ctagcagcta taatattgct actcctcttt 
tttgtctctt ccagaatcga agctgtaaaa 
actaagatct accgcagacc cctggaccgg 
atcaaaggca cccctcctga ggaaatctca 
gcaggaagca gttagagcgg tctcggccaa 
gagatggggg actgagagac aggactagct 
gcctagctgg gaaggtgacc acatccacct 
cctgaccaat cagagagctc actaaaatgc 
agccaatcat ctattgcctg agagcacagc 
agtcttcgag ccggcaacgg caaccccctt 
ttttcatgct atttcactct attaaatctt 
acggcttgag ctgagctttc gctcgccatc 
cgccgctgac tcccatccct ctggatcatg 
aggcacccat tgccgctccc aatcgggcta 
tgcctgggtt catcctaatt gagctgaaca 
tgacccacag cttcrtaatag agctataaca 
gaatccataa ggccaagaac cccaggtcag 
ctctgtgagc aaggaccccc aagtaacaca 
atggtagagc aagaaaacag aagggccctg 
cctgccctgg atgtcctatt cctaggtgtt 
tcacttctcc aagtagggct tctattacag 



attcggactt ccccgaggcr tacagagtga 7200 
ccagggagta tcccaggcct taggtatacg 726C 
gtcctcaggg aaggtcgac- aaatgaatga 7320 
ccaggaaacc caccccacai ggcctgccc _ 7380 
ctttccccaa aaagcaggac ttagcccata 7440 
caatgacctt g-gcccgacc caagacagcc 7500 
aaacatcaac aagttcttaa aacattacaa 7560 
ctattccacc cttgtgaca* ggcattagtc 7620 
gatacatcct gggaaggacc ctacccagtc 7680 
gctggagtgg agtcttggac acatcacact 7740 
cctgaaaatc caggagacaa cgctagctat 7800 
ctcttcaaac aacaaccagg aggaaagzaa 7860 
tatcatattt ttctctttac tgttcttuta 7920 
tgccgctgta tgaccagtag ctccccttac 7980 
ggaaatattg atgccccatc gtataggagt 8040 
cacacccata tgccccgcaa ccgctaccac 8100 
cattattgga caggaaaaa- gattaazccc 8160 
tgttggactt actccaccca aactggtaTig 8220 
agagaaaaac atgtaaaaga agtaatctcc 8280 
ccctacaaag gactagatct ctcaaaacta 8340 
gtaagcctat ctaacaccac cctcactggg 8400 
aactgttgga tatgcctccc cctgaactcc 84 60 
caatggaaca acttcagcac agaaacaaac 8520 
tccaatctgg aaataaccca tacctcaaac 8580 
tacacaacca actcccaatg catcaggtgg 8640 
ccctcaggaa tattttttg- ctgrggtacc 8700 
gaatctatgt gcttcctctc attcttagtg 8760 
ttatacagtt atgtcatatc taagccccgc 8820 
ataggagcag gagtgctagg tgcactaggt 8880 
cagttctact acaaactatc tcaagaacta 8940 
ctggtcacct tgcaagatca acttaactcc 9000 
gctttagact tgctaaccgc tgaaagaggg 9060 
tgttattatg ttaatcaatc cggaatcgtc 9120 
atacaacgta gagcagagga gcttcgaaac 9180 
atgccctgga tcctcccctt cttaggacct 9240 
ggaccctgta tcrttaacci ccttgttaac 9300 
ctacaaatgg agcccaagat gcagtccaag 9360 
cctgctagcc cacgatctga tgttaatgac 9420 
gctgcacaac ctctactacg ccccaattca 9480 
cctccccaac agcacttagg ttttcctgtt 954 0 
ggatttccta ggctgactaa gaatccctaa 9600 
ttaaacacgg ggcttgcaac ttagctcaca 9660 
taattaggca aagacaggag gtaaagaaat 9720 
aggagggaca atgatcggga tataaaccca 9780 
tgggtcccct ccctttgtat gggagctctg 9840 
gcaactgcac tcttctggtc catgtttctt 9900 
caccactgct gtttgccgcc accgcagacc 9960 
cagggtgtcc gctgtgctcc tgatccagcg 10020 
aaggcttgcc attgttcctg catggctaag 10080 
ctagtcactg ggttccatgg ttctcttctg 10140 
ctcaccgcat ggcccaaggt tccattcctt 10200 
agaacacgag gcttgccacc atcttgggag 10260 
accatgaggg tgcaaatgca tgggccacta 10320 
gttcctcgaa ggcatcagtg agctgaaatg 10380 
tttctgcctg aagcagatta aaccctttgt 104 4 0 
cccaaatcaa tccccacccc agatgacat 104 99 
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<210> 4 
<211> 2784 
<212> ADN 

<213> Homo sapiens 
<400> 4 

ctccttcagg agaacaaaga acaggccact 
cccatatgcc caaatctcag ggatttcagt 
gttgggcaga ggccttcccc tgtaggacag 
aaataattcc cagattcgga cttccccaag 
aggctacagt aacccaagga gtatcccagg 
cctggaggcc acagtcctca ggaaaggtgg 
taaaaaagct aatccaggaa acccacctcg 
taagaatccg aaactctccc caaaaagcag 
ggcccttcct aaccaatgaa ctcgggcttg 
tcatctcctt agccaaatat caacaggttc 
aagagggaaa ggaactattc caccctggtg 
attccccatc cctagataca tcctgggaag 
cggcagttaa agtggctgga gcggagtctt 
tactgccaaa ggaactcaaa aatccatgag 
aggatctgcg cctgctcttc aaatgacaac 
cctggccctc ccttatcata tttttctctt 
tgcaccccgt ccatgccact gcaccccgtc 
agcaagagtt tctatggaga atgcagcgtc 
gtttatctaa gggaaccccc accttcactg 
actctgccac tctttgcatg catgcaaata 
ccagttgtcc tggaggactt ggaggactca 
tggagttcaa gatcaggcaa cagaaaaaca 
ggtacatagc acccctggcc cctacaaagg 
cc^Sttacccat actggcctgg taagcctatt 
ctcggcccaa aaccctacta actgttggat 
ttcaatccct atacctgaac aatggaacaa 
tttagtaggt cctctttcca atctggaaat 
atttagcaat actatagaca cagccaactc 
acgaatagtc tgcctaccct caggaatatt 
tttgaatggc tcttcagaat ctgtgtgctt 
ctacactgaa caagatttat acaatcatgt 
cattcttcct tttgttattg gagcaggagt 
tatcacaacc tctactcagt tctactacaa 
atgggtcgct gataccctgg tcaccttgca 
ccttcaaaat cgaagagctt tagacttgct 
tttagaggaa aaatgctgtt gttatgttaa 
agaaattcaa ggtcgaatat aacgtagagc 
cctcctcagc caatggatgc cctggattct 
attgttactc ctctttggac cctgtatctt 
aatcgaagca gtaaaactac aaatcgttct 
taaaatctac cacggacccc tggaccggcc 
caaaggcacc cctcccgagg aaatctcaac 
aggaagcagt tagagtggtt gttggccaac 
agagggggga ctgagagaca ggaataacta 
actagctggg aaggtgaccg cttccacctt 
ccaaccaatc agatactaaa gagagctcac 
aaagaaatag ccaatcatct gttg 



acccaagaga agactggcaa ctagatttta 60 
atctactagt ttgggtagat actttcactg 120 
aaaaggccca agaggtaata aacgttcatg 180 
gcttacagag tgacaatggc cctgctttca 240 
tgttaggtat acaatatcac tcacactgcg 300 
agaaaatgaa caaaacactc aaatgacatc 360 
catggcctgc tctgttgcct atagccttac 420 
gacttagtcc atacaaaatg ctgtatggac 480 
accgagagac agccaactta gttgcagaca 540 
ttaaaacatt acagggagcc tgtccccaag 600 
acatggtatt agtcaagtcc cttccctcta 660 
gaaactaccc agccatttta tctaccctaa 720 
ggatacatca cactcaagtc aaaccctgga 780 
acaatgccag crattcctgt gaacctcrag 840 
cagggggaaa gtaactaaaa tcgtaaatcc 900 
tactgttctc ttaccccctt tcacrctcac 960 
catgccccgt ccatgccagt agctcccctt 1020 
ccggaaatat tgatgcccca ttgtatagga 1080 
cccacaccca tatgccccac aactgctata 1140 
ctcattattg gacaggaaaa acgattaatc 1200 
cttcactcat accagtatgt ctgatggggg 1260 
cataaaggaa gtaatctccc aactgacctg 1320 
actagatctc tcaaaactac atgaaaccct 1380 
taataccacc ctgactgggc tccatgaggt 1440 
gtgcctcccc ctgcacttta ggccatacat 1500 
cttcagcaca gaaataaaca ccacttctgt 1560 
aacccatacc tcaaacctca cctgtgtaaa 1620 
ccaatgcatc aggtgggtaa ctcctcccac 1680 
ttttgtctgt ggtacctcag cctatcattg 1740 
cctctcattc ttagtggccc ctatgcccat 1800 
catacctaag ccccgcaaca aaagagtacc 1860 
gctaggcgga gtagctactg gcattggcgg 1920 
actgtctcaa gaactaaatg gtgacatgga 1980 
agatcaactt aactccctag cagcagtagt 2040 
aaccgcggaa agcgggggaa cctttttatt 2100 
tcaatccgga atcatcaccg agaaagttaa 2160 
aaaggagctg caaaacactg gaccctgggg 2220 
ccccttctta ggacctctag cagctataat 2280 
taacctcctt gttaagtttg tcttttccag 2340 
tcaaatggag ccccagatgc agtccatgag 2400 
tgctagccca tgctctgatg ttaatgacat 24 60 
tgcacaacct ctactacgcc ccaattcagc 2520 
ctccccaaca gcagttgggt tttcctgttg 2580 
gatttcctag accaactaag aatccctaag 2640 
taaacaccgg gcttgcaact tagctcacgc 2700 
taaaatgcta attaggcaaa aacaggagat 2760 

2784 
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<211> 1799 
<212> ADN 

<213> Homo sapiens 
<400> 5 

gggattctta gtcggcctag 
aggaaaaccc aagtgctgtt 
aattggggca tagtaggggt 
cattacaatt ggagcatggg 
tggacttcat ctggggttcc 
aagagacaaa cttaacaagg 
gagctgctag agatcctaag 
agggtctggt gttttcgaag 
actttctctg tgacaattca 
acataataac aacattcttc 
aagtctaaag ctcttcaatt 
aaggtgacca gggagtcggc 
tagtagaact gagtagaggt 
cctgctccga taacaaaagg 
taattgtata aatcttgtrc 
acatagattc tgaagagcca 
ttcctgaggg taggcagact 
tggttgtgtc tacagtattg 
ccagattgga aacaagaggt 
tgttccattg ttcaggtaca 
accaacagtt agtagggttt 
ataggcttac caggcaagta 
ctttgtaggg gctaggggtg 
gtttttctct tgcctgatct 
aagtccgaca gacagtggct 
tccaataatg agtatttgca 
tatgggtgtg ggcagtgaag 
caatatttct gggaagccgc 
tacagcagca tggagggggt 
aaatatgata agggagggcc 



gaaatccagc taatcctgtc 
ggggaggttg gctgacgacc 
tgtgcagttg agatttcctc 
ctagtaggcc ggtccagggg 
atttgaagaa cgatttgtag 
aggttaaaga tacagggtcc 
aaggggagaa tccagggcat 
ctcctctgtt ctacgttgta 
ggattgatta acataataac 
ccctaaaaat aaacagcttc 
ttgaaggacc actgatgcta 
aacccattcc atgtcaccat 
tgtggtaccg ccaatgccag 
aagaatgagt actcttttgt 
agtgtaaatg gtcatggggg 
ttcaaacaac gataggctaa 
attcgtgtgg gaggagttac 
ctaaatttta cacaggtgag 
cctactaaaa cggaagtggt 
gggattgaaa tgcatggcct 
tggaccgaga cctcatggag 
tgggtatgga gggtttcatg 
ctatgtaccc gggtcagttg 
tgaactccac ccccctcaga 
ccaagtcttc caggacaact 
tgcatgcaaa gagtggcaga 
gtggagtttc ctttaggtaa 
attcttcata gaaactcttg 
gcagtgagag tgaaaggggg 
atggggattt acgattttag 



tctcaguccc cccactcaac 60 
agtctaaccg cttcctgcgc 120 
gggaggggtg cgttcgata- 180 
tccacggtag accttagtca 240 
ctttacaaci tcgattctgg 300 
aaagaggagc a-caatat-a 360 
ccattggctg aggaggcccc 4 20 
ttcaatctcg aattrc* tea 480 
aacattcttc cgctaaaata 540 
cccctctttc agaggttagc 600 
ggaagttaag ttgatct tec 660 
tgagttcttg agacagtttg 720 
aacctagtcc acctagcacr 780 
tgtggggctt aggtacaaca 840 
cactaagaac gagaggaagc 900 
ggtaccacag acaaaaaata 960 
ccacctgatg cattgggagt 1020 
gtttgaggta tgggttattt 1080 
gtttatttct gtgctgtagt 1140 
gaaatacagg gggaggcaca 1200 
cccagtgagg gtggtattaa 1260 
tagttttaag agatctagtc 1320 
ggaggttact tcctttacat 1380 
cataccagta tgggtgaagt 1440 
aggattaatc attttccctg 1500 
gttatagcag ttgtggggca 1560 
actcctattt gatggggcat 1620 
gtaaggggag ctgctggttg 1680 
taagagaaca gtaaagagaa 1740 
ttactttcct cacggttgt 1799 



<210> 6 
<211> 1489 
<212> ADN 

<213> Homo sapiens 
<400> 6 

tggtgcttgc cccgggcact ctcagtcctg 
ctcagaggac ctacgtcccc tggggcagtg 
gcatggacga gggggegget tatttctatt 
accgcactgg aagcaaaccc tattaggcat 
gcctccaaag tccgcttgcc tgagggecat 
tttgtcccat tctgcctgct catcctgatc 
caatagggtt tctaagtttt gttccgggcc 
gtctgtagct gactgagtga taaacttatc 
agttgacaga gagaggtatg cttcctcaat 
ggattttctt cctttccctg tgttatagtg 
ctagttttcc ttagtccttc tagcaegcaa 
tgttctgatt ctgtgtccca gtgagggtct 
aatcgttctc tttcctctgt tgtcgaccta 
ccaaactctc aggctgeagt taeggegaca 



ctgctggatc atctggttag tggcttctga 60 
ggccttacag tgattccctt gacacgaggt 120 
tggacaatct tttttaaagt gtccttgtag 180 
ttgatttgee tagcttttcc cttttccagt 240 
gaetaaageg gtggcctttt ttttatccca 300 
tctattataa aaaactgagg ttgccaagtt 360 
taaggcagac ttttgaagtt ttttcctaat 420 
ctttaagatt agttggcctt cagtagagtc 480 
gcctccgtta gtcactccag aaaggcggta 540 
gacatcattg aataactcac aggcttcttt 600 
gttagcaaat gtctgeggea ccaatctcca 660 
acactgggaa ctgcctgctg gcctgtgggg 720 
tcattgacct gactgagata ccagagatcg 780 
cttcrgtcat ttggggttag tgtctgattt 840 
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agcagtaaca ttatatctct ccatatcaga 
tcaatatagc cattagggtt atctgagaat 
ggagagaaaa aggcacatgc actctggctg 
agagagaaaa aggtacgtgc actctggctg 
ggcataatcg gggaatattg gcattctttg 
tttggaccgt ttgggttgaa ggggggtcct 
tggggtaggg aggtagactc tgagggcttc 
attgcgagtt gtctcttaat gaaaagaaag 
cttcttttct acaaaagagg tctagctgta 
gatgccaggt ttctccccct taaagagtat 
tgtctttttt ttcttagcat ctgagagtca 



tcaaaggatt gtcctaaacc ttgtaaaaca 9CC 
ttacctaggt ctattttaa" ttaaagtcrg 96C 
ggccgaatcc tcttcctccc actgcgtccg 1020 
ggccgaattc tcctcccac; gcttggaggg 1080 
gttagttgtt taccccrtrg tczatczccz 1140 
tattatttgg ggaaggagtc tgggggatgc 1200 
ctgtagggca taaatcacac tttttacata 1260 
tttgtacgta tgacacttca caccatttgc 1320 
agatggtgtt ataatttatg cttccctcac 1380 
atcgttgcca ggcggtactg cagaagaata 1440 
aattggtccc aattctcca 1439 



<210> 7 
<211> 1216 
<212> ADN 

<213> Homo sapiens 



<400> 7 

taaagataca gggattgaaa tgtatggcct 
gaaaatgggg tttcctttag aaaaactcct 
ccgcattctc catagaagct cttggtaatg 
gggtgcagtg agagtgaaag agggtaaaag 
gggttcagtg agagtgaaag ggggtaagag 
gccatgagga tctacgattc tagttacttt 
agatcctcta gaggttcaca ggaatagcta 
ggcagtatac agagtttgac tcgagtgtga 
accgcagttg gggtagataa aatgactggg 
ggggacttag aaggaaggga cttgactaat 
ccctcttctc gggaacaggt tccctgtaat 
gaggtgatgt ctgcaactaa gctggccatc 
aagggccatc catacagcat tttgtatggg 
attcttagta aggctgtagg caacagagca 
ttttttaaat gtcgtttgag tgcttcattc 
ctccacgcgc agtgtaagtg atattgtatg 
gtagccttga aaacggggcc attgtcactc 
attatttcat gaattagtgc ctttattaca 
gcctctgccc aaccagtgaa aatatctacc 
ttgggcatgt gggtaaaatc tagttgccag 
tctcctgaag gagctt 



gaagtgcagg gtcatatagg tgtgggtggt 60 
atacgatggg tcatcaata" ttccaggaag 120 
ggagctactg gtagtacagr ggcacggagg 180 
aacagtaaag agaaaaatat gataagggag 240 
aacagtaaag aaaaaaatat gacaaggagg 300 
cctcacggtt gtcgcttgaa gagcaggtgc 360 
gcgttgtctc ctggattttc gggttccttt 420 
tgtattcaag actccactcc agccacttta 480 
tagggtcctt cccaggatgt atctaaggat 540 
accatgtcac cagggtgcaa taattacttt 600 
gttttaagaa cttgttgata tttggccaag 660 
tctcggtcaa gcacaaggtc cttggttagg 720 
ctaagtcctg ctttttgggg agagttttgg 780 
ggccatgcaa ggtgggtttc ttgggttagc 840 
attttcttga cttttcctga ggattgtggc 900 
cctaatgcct gggatactcc ctgggttact 960 
tgtaagcctc ggggaagtcc gaatctggga 1020 
tcttggtcct tttctgtcct acaaaggaag 1080 
cagactagta gatactgaaa tccctgagat 1140 
tcttctcctg agtaatggcc tgttctttgt 1200 

1216 



<210> 8 
<211> 976 
<212> ADN 

<213> Homo sapiens 



<400> 8 

agtgataatg gaatacttga aagtaatccc 
aaactaatag ccctcactcg ggcactagaa 
acagactata agtatgctta cctagtcctt 
gaattcctaa cttccaaagg aacacctatc 
ttggtggtac agaaacctaa agaggtggca 
aaggaaaggg aaatagaagg gaactaccaa 
caggaccctc cattagaaat gcttatagaa 
gaaagcaatc cccagtactc agcaggagaa 
ttcctcccct caggatggct agccaccaaa 
caatggaaat tacttaaaac ccttcaccaa 



ctcactccag gaactagtgc tgagctggcc 60 
ttaggagaag agaaaagggt aaatatatat 120 
catgcccatg cagcaatatg gagagaaagg 180 
aaacatcagg aagccattag gatattatta 240 
gtcctacact gctggggtca tcagaaaaaa 300 
gcagatattg aagccaaaag agccgcaagg 360 
ggacccctag tgtggggtaa ccccctccag 420 
ataaaatgga gaacctcacg aggacatact 480 
gaaggaaaaa tgcttttgcc tgcagctaac 540 
acctttcact taggattgat agcacccatc 600 
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agatggccaa attattattt actggatcag 
gggcctgtaa agtgtgccaa agaaataatc 
ctgtatcttt aacctccttg ttaagtttgt 
aatggttctt caaatggagt ctcagatgca 
ggagggggcc tgctagccca tgctccaatg 
aaatctcaac tgcacaaccc ctactatgtc 
atcggccaac ctcccc 



9 

gccttttcaa aactatcaag caggtagtcs 660 
tcctgcactg caagccacac atttcaatcc 720 
ctcttccaga atcaaagctg taaaactaca 780 
gtccatgact aagacatacc gcagccccct 840 
ttaatgacat cgaaggcacc cctcccgggc 900 
ccaattcagc aggaagcact taaagcggi:c 960 

976 



<210> 9 

<211> 942 

<212> ADN 

<213> Homo sapiens 

<400> 9 

agaggagaac agcagcataa gcggctggca 
agagaaagag aaagagaaag tcagagaaag 
aaagtcaaag aggtagtagt cagaaacaga 
gacacagaaa gtcaaaaaaa aagttaagaa 
ggagaaagag agagatagaa gtagtaaaga 
cagggtaaat ttctatctac ccagccaagg 
tatctgcctc tcagacagtt tgcaagaaat 
aatagactct ttggcagcag tgactctcca 
tgaaaaagga ggacactaca ccttcttagg 
ggggatagta tgagatgctg cccggagttt 
cctttcaaat tcttatacca acttctggag 
tcctgtggca gccatcttgc tgttactcgc 
caaatttgtt tcctctagaa tcgaggccat 
ccaaaagagt tcaactaaca acttctaccg 
ccctggccta gagagttccc ctctgaagga 
atccagcagg agtagctaga gtggtcatcg 



gaggtaggga aagaccagca agaagaaaag 60 
agacagagag aggaagagae aaagagacag 120 
gacaaaaaaa aggagtcaga aagagggaca 180 
gaaaggaaaa gacaaagaag aagtcgaaga 240 
aaaaaacagc atatcccatr cctttaaagc 300 
catattctac ttatgtgga- cttcaaccca 360 
aatgaaatct atccttactt tacaatccca 420 
aaactgcaga ggcctagacc tcctcactgc 480 
ggaagaatgt tgtttttaca ctaaccagtc 540 
acaggaaaag gcttctgaaa tcagacaacg 600 
ttaggcaaca tggcttctcc cctttctagg 660 
ctttgggccc tgtattttta accttcttg- 720 
caagctacag atggtctcac aaatggaacc 780 
aggacccctg gatcaaccca ctggcacttc 840 
caccgcaact 'gpagggccct tctttgcccc 900 
gccaaattgc ca 942 



<210> 10 

<211> 1375 

<212> ADN 

<213> Homo sapiens 

<400> 10 

ccccaatatt ctctttctga tggggaaaaa 
actatcctgc agcttgatct tttctgtaag 
gtccaagctt tcttttcatt gagggagaat 
cccacaggag gacccctcag cttaccccca 
attgatgata ctcctcctct aatctcccct 
aaaggtccac aaaaaccccc gggctatcgg 
gaatttggcc caacccgggt gcatgtcccc 
cagacctggg gaagttttca gatgatcctg 
ggcaaacctt tgacctcact tggagagacg 
ttaatgaaaa gaatgcggct ttagctgcag 
gtcaagtaaa tgaaagaatg acagccgaag 
ccatccccag tatggatccc cactgggact 
aacatctgtt gatctgtgtt ctggaaggac 
attcaatgat atccaccata acccagggaa 
ggctacaaga ggccttaaga aaatatactc 
tgattctaaa agataagttt attacccaat 
agcaagccct gagccctgaa caaaatctag 
tctataatag ggaccaagag gaacaggccc 
cagccttagt catggccctc agacaaacaa 



tggccacctg agggaagcac aaattacaat 60 
agggaaggca aatggagtga aataccttat 120 
acacaactat gcaaagcttg caatttacat 180 
tatcctagcc tccctatagc ttcccttcct 240 
gcccagaagg aaataagcaa agaaatctcc 300 
ttatgtcccc ttcaagctgt agggggaggg 360 
ttctccctct ctgatttaaa gcagatcagg 420 
ataggtacat agatgtccta cagggtctag 480 
tcatgctact gttagatcaa accctggcct 540 
cctgagagtt tggagatacc tggtatccta 600 
aaagggacaa cttccctact ggtcagcaag 660 
ttgactcaga tcatggggac tggagtcgta 720 
taaggagaat tgggaaaaag cccatgaatt 780 
aggaagaaaa tccttctgcc ttcctcgagc 840 
ccctgtcacc cgaatcactc gagggtcaat 900 
cagccacaga tatcaggaga aagctccaaa 960 
agacattatt aaacctggca accttggtgt 1020 
aaaaggaaaa gcgagatcag agaaaggccg 1080 
accttggtgg ttcagagagg tcagaaaatg 1140 



W099/67395 



PCT/FR99/01513 



gagcaggcca atcacctggt acggcttgtt 
aagatcgtcc aataagaaac aagctgcccc 
actggaaggt gcactgcccc agaggatgaa 
tgatccaaca acaggactga gggtgcccgg 



10 

atcagtgcgg tttactagga cactttaaaa 1200 
ctcatccgtg tccactacgc cgaggcaacc 1260 
ggttccctgg gttagaagcc cccaaccaga 1320 
ggcaagcacc agctcatgtc atcac 1375 



<210> 11 
<211> 944 
<212> ADN 

<213> Homo sapiens 



<400> 11 

acctaggagg aactgtcttc aggacaggac 
aaaaagacac aatgggtatt cagtaagtga 
aaaattgcct aataattggt ctgctcaaat 
aaaagtatta cagaatcagg aagaagccat 
acgagaactt attaatagca aagaataatt 
aagcacagtt tgctaaaagt taactgtgta 
aaatgatttc tcagacagtt tgcaagaaac 
aatagactct ttggcagcag tgactctcca 
tgagaaagga ggactctgca ccttcttagg 
agggatagtg tgagatgcca cccagcgttt 
tgcttttcaa accttatagc aacctctgga 
tcctgtgaca gccatcttgc tattactcgc 
caaatttgtt tcctctagga tcgaggccat 
ccaaatgagc tcgactaaca acttctactg 
aactggctta aagagtttcc ctctggagga 
catccacagg aagttagcta gagcagtcat 



tatagatgct tcctcccagg cgattaaggg 60 
taaggaaact cttgtagaag cagagtcagg 120 
gtgcgagctg tttgcactca gccaaacctr 180 
ctataccaat tctaagrraa tatggactga 240 
gaaatcccaa acttacaagg ttttcaacaa 300 
acatgtatta tcctactacc acaaactcrc 360 
aacgaaacct atccttactc tacaatccca 420 
aaaccaccaa ggcctagacc tcctcactgc 480 
ggaagattgt tgtttttaca ctaaccagtc 540 
acaggaaaag gcttctgaaa ccagacacaa 600 
gttcggcgac tggcttttcc cctttctagg 660 
cttcgggccc tgtattttca acctcctcgt 720 
caagctacag atggtcttac aaatggaacc 780 
aggacccctg gaccgaccca ctggcccttt 84 0 
cactacaact gcagggcccc ttctttgccc 900 
cacccaattc ccaa 944 



<210> 12 
<211> 963 
<212> ADN 

<213> Homo sapiens 



<400> 12 

tacaggaacc ccataatacg tccttggcaa 
cccatttgtc ctgaaccctc aaatcatggg 
ccttatgagt tttcagctac aggggtgtat 
tggaagatcc ttctatattt gcctccccac 
catagtacct cctgtgactt atccttttca 
aagcttcagc cgagagcaat ctcactactt 
acctaggaag tggactcaca gcctagatga 
ccaaatagac tcattagcag ctgtggttct 
cctcactgcc gaaaggggag gaacatgcct 
caataaatca ggcatagtga gagatggaat 
acatggtggg acaaccgaaa ctacctcagg 
tccattttta ggtcccttcc ttatgattat 
cagttccttc atcctttcgt ttcttcctga 
cagatggaac ctcagatgac ttcaaccagc 
gccggcccat acccggacgt tgacacccaa 
gaaccccttc tatgccccta ttcagcagga 
caa 



attctattca gctccaactg ctaggagtgg 60 
aatgagaaat gaatttagac tgaccacagc 120 
agaaccctga taaggagttt tctttgtgtg 180 
caactggaca ggaacttgta ctttagccta 240 
gaagaggcag tagctgtgcc cattcatgct 300 
cctctattgg ctggtttagg atttactacc 360 
aatctctctc caacttactc aaatccagga 420 
ccgaaccagt gagcactaga tctccaatct 480 
ttttctgaac aaggaatgtt gtttttatgt 540 
taaatgactt caggatagag ctagcagact 600 
gttctcacag cctgttctcc actggcttct 660 
tctaggagta acctttggcc catgtctttt 720 
atagaatcaa tgaaactaga aatgttactg 780 
acctattatc aaggacccct aaaccagcct 640 
accacctctc acgaggaaac ctcagctaca 900 
agcaattaga gtggtcatcc tcccacaccc 960 

963 



WO 99/67395 



PCT/FR99/0J513 



<210> 13 
<211> 1362 
<212> ADN 

<213> Homo sapiens 
<400> 13 

ccacaatatc ctcttccagg aggagaacga 
accatcctgc aactagatcc gttttgtaaa 
gttcagacct ttttctcatt aagggatgat 
caccccacag ggagtcctca aattctaccc 
actaatgcca aaccctctct ggcttctaca 
agagagccaa gagaccccac tggcccctgg 
tttggcccaa cccgagtaca tgttcccttt 
gacttggatg aaagttctca gatgacccca 
gacaatcttt tgacctttcc tggagagaga 
taatgagaag aatgctgctt taacaggagc 
ttaagtaagt gatagaatga catcagaaga 
cccagtatgg atccccactg ggaccctgac 
ttactgacct gtatcctaga agggttaagg 
atgatgtcta ctataaccca agggaaggaa 
agggaggctt tgagaaaata tactcccctg 
ttaaaggaca aatttattac tcagtcagct 
gccttgggcc gagcaaaatt tggaggcatc 
tagggaccaa gaggaacagg ccgaaaagga 
agtcatgccc tcagacaaac cttggcggtt 
cacccagcag ggcttattat cagtgcagtt 
agagaaataa gccgccctct cacccatgtc 
actgtcccag aggacaaagg ttctctgggc 
aggatggagg gtgcccgggg caagcaccag 



tggccacctg agggaagtat acactataat 60 
caagaaggca agtggattta ggtaccatat 120 
aacccacgat tgtgtaagac atgtaacctg 180 
ccatacccag tcctccccac ggctcctcct 240 
gcccaaaagg gaacaaataa aagagcctuC 300 
ctatgtcctc ttcaggctgt aggaggggaa 360 
tctctctctg atctaaagca aattaaggca 420 
atagatacgt agatggcctg ctgggtctgg 480 
tcatgttatt gcttgatcag acctaacctc 540 
ccgagagttt ggggatacct ggtacc=cag 600 
gagcagtttc ctactggcca gcaagcagrr 660 
tcggatcatg gggactggag tcacaaacat 720 
agaactagga aaaagcccat gaactarcca 780 
gaaaacccta ttgccttcct caaaaggctg 840 
tcaccagart ccctcgaagg ccagtcaatt 900 
gcagacatta ggaaaaagct ccaaaagtta 960 
attaaacctg gcaacctcag tgttctatca 1020 
aaagcaggat aagagaaagg ctgcagattn 1080 
caaagaggag aaaaaatgga gcaggccaar 1140 
tacaaggaca ctttaaacaa gattgtccaa 1200 
cactatgcca aggtgatcac tggaaggcac 1260 
cagaagtccc caaccagatg atccagcaac 1320 
ctcgtgttgt ca 1362 



<210> 14 
<211> 945 
<212> ADN 

<213> Homo sapiens 
<400> 14 

ttgcagatca atctcagact gctgtgctag 
ctctgagcca ggcatgggat ataatgtcct 
gcacagtatt agggtgggag tggcccgatt 
ggctaggaaa gagaattccc tgaccccttg 
gcttcagctc acactcaggt gactgcaccc 
cagtgagatg aacctggtac ctcagttgga 
tcacactggg agctgtagac tggagctgtt 
aatagactct ttggcagcag tgactctcca 
tgagaaagga ggactctgca ccttcttagg 
agggatggta cgagatgcca cccgatgttt 
cctttcaaac tcttatacca acctctggag 
tcccattgca gccatcttgc tattactcgc 
caaatttgtt tcctctagaa ttgaggccgt 
ccaaatgagc tcaactaaca acttctgcca 
cactggcctt aagagttccc ctctggaggg 
ctatccagca ggaagtagct agagcagtca 



caatgagtga ggcttcgtgg gcatgggacc 60 
tgtgtgccat ttgctaagac tgttggaata 120 
ttccaggtgc tgtctgtcac cgcttccctt 180 
ttcttcccag gtaaggcagt gcctcaccct 240 
actgtcctgc ccccactgtc ggacaagccc 300 
aatgcagaaa tcacctgtct tctgcgtcac 360 
cctatttggc catcttggaa ccatctccca 420 
aaaccaccaa ggcctagacc tcctcattgc 480 
ggaggagtgt tgtttttata ctgaccagtc 540 
acaggaaaag gcttctgaaa tcacacaaca 600 
ttgggcaaca tggcttctcc cctttctcgg 660 
cttcaggctg tgtattttta acctccttgt 720 
caagctacag atggtcttac aaatgggacc 780 
aggacccctg gaccaacctg ctggcccttt 840 
cactacaact gcagggcccc ttctttgccc 900 
tcacccaatt cccaa 945 
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<210> 15 
<211> 939 
<212> ADN 

<213> Homo sapiens 
<400> 15 

agagctacct tggcaagtac 
cattttaaca tacacaatca 
catcgaccta tatctgcctc 
gtcccaacag taacattgcc 
tctgtcagtg cagagccata 
ctacaggaac cagaatagct 
atgatttctc agacagtttg 
tagactcctt ggcagcagtg 
agaaaggagg actctgcatt 
cagtatgaga tgccactcgg 
caaactctat accaaactct 
gacagccatc ttgctattat 
tgtttcctct ggatcgaggc 
gagctcaact aacaacttct 
cctgaagaat tcccctctgg 
agcaggaagt agctagagct 



tctaggagta tgggaaaatg 
ggtctgccca cccagcaagg 
cccactaact agacagccac 
ccaggaaatc agaccatatc 
caactaatac ccctactcat 
agtttgttta cttcattatc 
caagaaataa cgaaatctat 
accctccaaa acggctgagg 
ttcttagggg aagagtgttt 
agtttacagg aaaaggcttc 
ggagttgggc aacatggctt 
ttgcctttga gccctgtatt 
catcgagcta cagatggtct 
actgaggacc cctggactaa 
aggacactac aactgcaggg 
gtcattgcct aattcctaa 



aaaacaacaa actcacacac 60 
tatattcttt gcacgtggaa 120 
ccgaatctta gtctttctsa 180 
agtarccctc aaagctcaag 240 
agggtaagga atggccaczg 300 
ctactaccac acactctcaa 360 
ccttactcta caatcccaaa 420 
cctagacctc ctcactgcca 480 
ttacactaac cagtcaggga 540 
tgaagtcaga caatgcct" 600 
ctcccctttc taggtcccgr 660 
ttcaatctcc ttttcaaac. 720 
tcacaaatgg aaccccaaaz 780 
cctgctgacc ctttcactgg 840 
ctccttcttt gcccctatcr 900 

939 



<210> 16 
<211> 979 
<212> ADN 

<213> Homo sapiens 
<400> 16 

agtgataatg gaatacttga aagtaatccc 
cagaactaat agccctcact cgggtactag 
atacagactc taagtgtgct tacctagtcc 
gggaattcct aacttccgag ggaacaccta 
tattggctgt acagaaacct aaagaggtgg 
gaaaggaaag ggaaatacaa gggagccacc 
ggctggaccc tccattagaa atgcttatag 
gggaagccaa gccccagtac tcagcaggag 
cttccctccc ctccagatgg ctagccacca 
accaatagaa attacttaaa acccttcatc 
atgagatggc caaattatta tttactggac 
tcagggcctg taaagtctgc caaagaaata 
tccctgtatc tttaacctcc ttcttaaatt 
acaaatagtt cttcaaatgg agccacagat 
cctggaccag cctgctagcc catgctccaa 
aggaaatctc aactgcacaa cccctactac 
gtcatcagcc aacctcccc 



ctcactcccc aggaactagt gctcagctgc 60 
aatcaggaga aggaaaaagg gtaaatatat 120 
tccatgccca tgcagcaata tggagagaaa 180 
tcaaacatca ggaagccatt aggaaattat 240 
cagttttaca ctgccggggt catcagaaag 300 
aagttgatat tgaagtcaaa agagccacaa 360 
gaggacccct agtatggggc aatcccctcc 420 
aaatagaata gggaacttca tgaggacata 480 
ataaaggaaa aatacttttg cctgcagcta 540 
aaaccttcca cttaggcatt gatagcaccc 600 
caggcctttt caaaactatc aagcagatag 660 
atcccctgca ctgcaggcca tacatttcaa 720 
tgtctcttcc agaatcaaag ctgtaaaatt 780 
gcagtccatg actaagatcc accacagacc 840 
tgttaatgac atcgaaggca ccccctcctg 900 
gccccaattc agcagaaagc agttagagtg 960 

979 



<210> 17 
<2U> 1774 
<212> ADN 

<213> Homo sapiens 
<400> 17 

catgctggta aaggaccgct agaatccagc 
aggtgggaaa acaggtgcag gactgctaca 
ggtccatggg tggttacgca ccctggaaag 



agccaggacc actttctttg tggtcaagaa 60 
ctggtaagca taactaatcc gataagcaga 120 
gaataagcat taggactata gaggacactc 180 
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taggactaat gctcatcgga aaatgactag gggtactggc atcccratg- ccttttttca 240 
gatgggaaat gttcccccca aggcagaaat gcccctaaga tgtacrcccc agaaatggga 300 
ccaatctgac catcagacac taagaaagaa acgacttaca ttcttctgca gtaccacctg 360 
gccacaatat cttcttcaag gggcagaaac ctggcctccc gagggaagta taaattatas 420 
caccatctta cagctagacc tcttttgtag aaaagaaggc aaatggagtg aagtgccata 4 80 
tgtacaaact ttcttttcat taagagataa ctcccaatta tgtaaaaagt gtgatttatg 540 
ccctacagga agccctcaga gtctacctcc cgaccccagc aagaccccaa ctccttctcc 600 
aactaataag gacccccctt caacccaaat ggtccaaaag gagatagaca aaggggtaaa 660 
caatgaacca aagagtgcca atattacacg attatactcg ctccaagcag tgggaggaga 720 
atttggccca gccagcgtgc atgtaccttt ttctctccca gatttaaagc aaattaaaat 780 
agacctaggt aaattctcag ataaccctga tggctatatt gatgttttac aagggttagg 84 0 
acaatccttt gatctgacat ggagagatat aatgttactg ctaaatcaga cactaacccc 900 
aaatgaaaaa agtgctgcca taacagcagc ctgagagttt ggcgaactct ggtatctcag 960 
tcaggtcaat gataggatga caacagatga aagagaatga ttccccacag gccagcaggc 1020 
agttcccagt gtagaccctc attaggacac agaatcagaa cttggagatz ggtgccacag 1080 
acatttgcta acttgcgtgc tagaaggact aaggaaaact aggaagaagc ccatgaatta 114 0 
ttcaatgatg tcccctataa cacagggaaa ggaagaaaat cctactgcct ttctggagag 1200 
actaagggaa ggattgagga agcatacctc cctgtcacct gactctatta aaggccaact 1260 
aatcttaaag gataagttta tcactcagtc agctgcagag attaagaaaa aacttcaaaa 1320 
gtatgcctta ggcccagagc aaaacttaga aaccctactg aacttggcaa cctcagtttt 1380 
ttataataga gatcaggaag agcaggggaa tgggacaaat gggataaaaa aaaaaaaaaa 144 0 
aggtgactgc tttagtcgtg gccctcaggc aaatggactt tggaggctcc agaaaaggga 1500 
aaagctgagc aaattgaatg cctaacaggg cttgcttcta gtgtggtcta caaggacact 1560 
ttaaaaaaga ttgtccaagt agaaacaagc tgcccccttg tccatgcccc ttatgtcaag 1620 
ggaatcactg gaaggcccac tgccccagga gatgaaggtc ctctgagtca gaagccacta 1680 
accagataat ccagcagcag gactgaggat gcccagggca agcgccagcc catgccatca 1740 
ccctcacaga gccttgggta tgcttgacca ttga 1774 

<210> 18 
<211> 938 
<212> AON 

<213> Homo sapiens 
<400> 18 

tgtaggaaga actcccttca ggacaggaca atagatggtt cctcccaggr gattaaggaa 60 
aaaagacaca gtattcagta agtgataagg aaactcttgt agaagcagag ttagaaaaat 120 
tgcctaataa ttggtctgct caaatgtgtg agttgtttgc actcagccaa atcttaaagt 180 
acttacagaa tcaggaagca gccatctata ccaattctaa gttaatatgg actaaacgag 240 
gttttattag tagcaaagaa aaattaaaat cccaaactta caaggttttc aactaaagtt 300 
tgccaaaagt taacagtgta acatgtatta tcctactatc acacactctc aaaggatttc 360 
tcagacagtt tgcaagaaat aacgtaatct atccttactc tacagtccca aatagactct 420 
ttggtagcag tgactctcca aaactgccga ggtctagacc tcctcaatgc tgagaaagga 480 
gaactctgca ccttcttagg ggaagagtgc tgtttttaca ctaaccagtc agggatagta 540 
tgagatactg cctgacgttt acaggaaaag gcttctgaaa tcagacaacg cctttcaagc 600 
tcttatacca acctctggag ttgggcaaca tggcttctcc ccttgctagg tcctgtggca 660 
gccatcttgc tattacttgc cttcgggccc tgtattttta acctccttgt caaatttgtt 720 
tcctctagga tcaaggccat caagctacag atggtcttac aaatggaacc ccaaatgagc 780 
tcaactaaca acttctactg aggacacctg gactgaccca ctggcccttt cactggccta 840 
aagagttccc ttctggagga cactacaact gcagggcccc gtcttcaccc ctatccagca 900 
ggaagtagct agatcagtca ttgcccaatt cccaacag 938 

<210> 19 
<211> 1308 
<212> ADN 

<213> Homo sapiens 
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<400> 19 

gatgcttgcc ccaggcaccc tcagtcctgt 
ccaaagaacc tttgtcctct gaggcagtgc 
catgggcaag ggggcagctt gtttctcact 
ccacactggt aacaagccct accaggtgat 
ccaccaaggt ttgtctgtct gagggtcatg 
ttttcctttt tggcctgttc ctcttggtac 
aacaatggct ccagattttg ttcagggcac 
ctgcagctga ttgggtaata aacttatctt 
gtgacagggg agtatatttc cttgaggcct 
tttcttcctt tccctgagtt ataaaagaca 
ttctccgtag tccttctaga acacaggtca 
ctgagtctag acaccagtgg ggatccatac 
tgtccctttc tttggctgtc attctatcat 
attctcaggc tgcagctaaa gctgcattct 
gcatgacatc tctccaagtg aggtcaaagg 
ggagaagggg acatacacct gagttagcca 
cataagcaat agcctgggga tttttgtggt 
tgggtggggg agattagagg aggcttatca 
ggatatgggg gtaagctgag aggtcatctt 
tgtggatttt ccttacaatg aaaataaagc 
ttccctctta cagaaaaggt caagctgcag 
tggccatttc ttcccatcag agagagaata 



14 



tgttggatca tctggtcggg ggcttctggc 60 
accttccagt gattgcctca gcattgcgga 120 
ggacaatctt ttttaaggtg tcc.ttccaaa 180 
tggcctgctc tattttctgr cctctctgaa 240 
actaaggctg cggcctttct ctgatcttgc 300 
ctattataga acactgaggt tgccaggttt 360 
agggctcatt ttggagcttt ctcctgatat 420 
ttaggatcaa ttgactctca agagagttgg 480 
cccatagccg ctctaggaag gcagaaggat 540 
tcattgaaca ac^catggac cttttcccaa 600 
gcagatgttt acgactccag tccccatgat 660 
tggggatggc ctgctgactg gtagggaatt 720 
ttacttgact aagataccaa gtatctccaa 780 
tttcattaaa ggccagggtt tgatctaaca 840 
tttgccctag atccatagga catcagagaa 900 
aattcccctc cctctacagc ttgaagggga 960 
cctttggaga tttctttgcr tgtttccttc 1020 
gtaataggaa ggggagctat agggaggcca 1080 
gtgggatgta aattgcaagc tttgcatagt 1140 
ttggacataa ggtatttcac tccatttgcc 1200 
gatagtactg taatttatac ttccttcagg 1260 
ctggggctgg gccatagt 1308 



<210> 20 
<211> 711 
<212> ADN 

<213> Homo sapiens 
<400> 20 

actgagagac aggactagct ggatttccta ggccgactaa gaatccctaa gcctagctgg 60 
gaaggtgacc acgtccacct ttaaacacgg ggcttgcaac ttagctcaca cctgaccaat 120 
cagagagctc actaaaatgc taattaggca aagacaggag gtaaagaaat agccaatcat 180 
ctattgcctg agagcacagc aggagggaca acaatcggga tataaaccca ggcattcgag 24 0 
ctggcaacag cagcccccct ttgggtccct tccctttgta tgggagctgt tttcatgcta 300 
tttcactcta ttaaatcttg caactgcact cttctggtcc atgtttctta cggctcgagc 360 
tgagcttttg ctcaccgtcc accactgctg tttgccacca ccgcagacct gccgctgact 420 
cccatccctc tggatcctgc agggtgtccg ctgtgctcct gatccagcga ggcgcccatt 480 
gccgctccca attgggctaa aggcttgcca ttgttcctgc acggctaagt gcctgggttt 540 
gttctaattg agctgaacac tagtcactgg gttccatggt tctcttctgt gacccacggc 600 
ttctaataga actataacac ttaccacatg gcccaagatt ccattccttg gaatccgtga 660 
ggccaagaac tccaggtcag agaatacgag gcttgccacc atcttggaag c 711 



<210> 21 

<211> 711 

<212> ADN 

<213> Homo sapiens 

<400> 21 

actgagagac aggactagct ggatttccta ggctgactaa 
gaaggtgacc acatccacct ttaaacacgg ggcttgcaac 
cagagagctc actaaaatgc taattaggca aagacaggag 
ctattgcctg agagcacagc aggagggaca atgatcggga 
ccggcaacgg caaccccctt tgggtcccct ccctttgtat 
atttcactct attaaatctt gcaactgcac tcttctggtc 
ctgagctttc gctcgccatc caccactgct gtttgccgcc 



gaatccctaa gcctagctgg 60 
ttagctcaca cctgaccaat 120 
gtaaagaaat agccaatcat 180 
tataaaccca agtcttcgag 240 
gggagctctg ttttcatgct 300 
catgtttctt acggcttgag 360 
accgcagacc cgccgctgac 420 
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tcccatccct ctggatcatg cagggtgtcc gctgtgctcc tgatccagcg aggcacccat 480 
tgccgctccc aatcgggcta aaggcttgcc attgttcctg catggctaag tgcctgggtt 540 
catcctaatt gagctgaaca ctagtcactg ggttccatgg ttctcttctg tgacccacag 600 
cttctaatag agctataaca ctcaccgcat ggcccaaggt tccattcctt gaatccataa 660 
ggccaagaac cccaggtcag agaacacgag gcttgccacc atcttgggag c 711 



<210> 22 
<211> 2055 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2055) 

<400> 22 

ccc aag aca gcc aac tta gtt gca gac ate acc tec tta gee aaa tat 48 
Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

caa caa gtt ctt aaa aca tta caa gga acc tat ccc tga gaa gag gga 96 
Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Glu Glu Gly 

20 25 30 

aaa gaa eta ttc cac cct tgt gac atg gta tta gtc aag tec ctt ccc 144 
Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

tct aat tec cca tec eta gat aca tec tgg gaa gga ccc tac cca gtc 192 
Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

att tta tct acc cca act gcg gtt aaa gtg get gga gtg gag tct tgg 240 
He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

ata cat cac act tga gtc aaa tec tgg ata ctg cca aag gaa cct gaa 288 
He His His Thr Val Lys Ser Trp He Leu Pro Lys Glu Pro Glu 
85 90 95 

aat cca gga gac aac get age tat tec tgt gaa cct eta gag gat ttg 336 
Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

cgc ctg etc ttc aaa caa caa cca gga gga aag taa eta aaa tea taa 384 
Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Leu Lys Ser 
115 120 125 

ate ccc atg gcc etc cct tat cat att ttt etc ttt act gtt ctt tta 432 
He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
130 135 140 

ccc tct ttc act etc act gca ccc cct cca tgc cgc tgt atg acc agt 480 
Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 
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age tec cct tac caa gag ttt eta tgg aga atg cag cgt ccc gga aat 528 
Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

att gat gec cca teg tat agg agt ctt tct aag gga ace cec ace ttc 57 6 
lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

act gee cac ace cat atg ccc cgc aac tgc tat cac tct gec act ctt 624 
Thr Ala His Thr His Met Pro Arg Asn Cys Tyr Kis Ser Ala Thr Leu 
195 200 205 

tgc atg cat gca aat act cat tat tgg aca gga aaa atg att aat cct 672 
Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 
210 215 220 

agt tgt cct gga gga ctt gga gtc act gtc tgt tgg act tac ttc acc 720 
Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

caa act ggt atg tct gat ggg ggt gga gtt caa gat cag gca aga gaa 768 
Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 

aaa cat gta aaa gaa gta ate tec caa etc acc egg gta cat ggc acc 816 
Lys His Val Lys Glu Val He Ser Gin Leu Thr Arg Val His Gly Thr 
260 265 270 

tct age ccc tac aaa gga eta gat etc tea aaa eta cat gaa acc etc 864 
Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 280 285 

cgt acc cat act cgc ctg gta age eta ttt aat acc acc etc act ggg 912 
Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

etc cat gag gtc teg gec caa aac cct act aac tgt tgg ata tgc etc 960 
Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp He Cys Leu 
305 310 315 320 

ccc ctg aac ttc agg cca tat gtt tea ate cct gta cct gaa caa tgg 1008 
Pro Leu Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp 
325 330 335 

aac aac ttc age aca gaa ata aac acc act tec gtt tta gta gga cct 1056 
Asn Asn Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

ctt gtt tec aat ctg gaa ata acc cat acc tea aac etc acc tgt gta 1104 
Leu Val Ser Asn Leu Glu He Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

aaa ttt age aat act aca tac aca acc aac tec caa tgc ate agg tgg 1152 
Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp 
370 375 380 
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gta act cct ccc aca caa ata gtc tgc eta ccc tea cga ata ttt ctt 1200 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe ?he 
385 390 395 400 

gtc tgt ggt acc tea gec tat cgt tgt ttg aat ggc tct tea gaa tct 1248 
Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 415 

atg tgc ttc etc tea ttc tta gtg ccc cct atg acc ate tac act gaa 1296 
Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr lie Tyr Thr Glu 
420 425 430 

caa gat tta tac agt tat gtc ata tct aag ccc cgc aac aaa aga gta 1344 
Gin Asp Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Val 
435 440 445 

ccc att ctt cct ttt gtt ata gga gca gga gtg eta ggt gca eta ggt 13 92 
Pro lie Leu Pro Phe Val lie Gly Ala Gly Val Leu Giy Ala Leu Gly 
450 455 460 

act ggc att ggc ggt ate aca acc tct act cag ttc tac tac aaa eta 1440 
Thr Gly lie Gly Gly lie Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

tct caa gaa eta aat ggg gac atg gaa egg gtc gee gac tec ctg gtc 1488 
Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 490 495 

acc ttg caa gat caa ctt aac tec eta gca gca gta gtc ctt caa aat 1536 
Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

cga aga get tta gac ttg eta acc get gaa aga ggg gga acc tgt tta 1584 
Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 520 525 

ttt tta ggg gaa gaa tgc tgt tat tat gtt aat caa tec gga ate gtc 1632 
Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly lie Val 
530 535 540 

act gag aaa gtt aaa gaa att cga gat cga ata caa cgt aga gca gag 1680 
Thr Glu Lys Val Lys Glu lie Arg Asp Arg lie Gin Arg Arg Ala Glu 
545 550 555 560 

gag ctt cga aac act gga ccc tgg ggc etc etc age caa tgg atg ccc 1728 
Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
565 570 575 

tgg att etc ccc ttc tta gga cct eta gca get ata ata ttg eta etc 1776 
Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
580 585 590 

etc ttt gga ccc tgt ate ttt aac etc ctt gtt aac ttt gtc tct tec 1824 
Leu Phe Gly Pro Cys He Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 600 605 
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aga ate gaa get gta aaa eta caa atg gag ccc aag azg cag tec aag 1872 

Arg lie Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 

610 615 620 

act aag ate tac cgc aga ccc ctg gac egg cct get age cca cga tct 1920 

Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 

625 630 635 640 

gat gtt aat gac ate aaa ggc acc cct cct gag gaa ate tea get gca 1968 

Asp Val Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala 
645 650 655 

caa cct eta eta cgc ccc aat tea gca gga age act tag age ggt cgt 2016 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Ser Gly Arg 

660 665 670 

egg cca acc tec cca aca gca ctt agg ttt tec tgt tga 2055 

Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 

675 680 685 



<210> 23 
<211> 28 
<212> PRT 

<213> Homo sapiens 
<400> 23 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro 
20 25 



<210> 24 
<211> 55 
<212> PRT 

<213> Homo sapiens 
<400> 24 

Glu Glu Gly Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys 
15 10 15 

Ser Leu Pro Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro 
20 25 30 

Tyr Pro Val He Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val 
35 40 45 

Glu Ser Trp He His His Thr 
50 55 



<210> 25 

<211> 38 

<212> PRT 

<213> Homo sapiens 
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Val Lys Ser Trp lie Leu Pro Lys 
1 5 

Ala Ser Tyr Ser Cys Glu Pro Leu 
20 

Gin Gin Pro Gly Gly Lys 
35 
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Glu Pro Glu Asn Pro Gly Aso Asn 
10 15 

Glu Asp Leu Arg Leu Leu Phe Lys 
25 30 



<210> 26 
<211> 540 
<212> PRT 

<213> Homo sapiens 
<400> 26 

He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
15 10 15 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
20 25 30 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
35 40 45 

He Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
50 55 60 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
65 70 75 80 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 
85 90 95 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
100 105 110 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
115 120 125 

Lys His Val Lys Glu Val He Ser Gin Leu Thr Arg Val His Gly Thr 
130 135 140 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
145 150 155 160 



Arg Thr His Thr Arg Leu Val Ser 
165 



Leu His Glu Val Ser Ala Gin Asn 
180 



Pro Leu Asn Phe Arg Pro Tyr Val 
195 200 



Asn Asn Phe Ser Thr Glu He Asn 
210 215 



Leu Phe Asn Thr Thr Leu Thr Gly 
170 175 

Pro Thr Asn Cys Trp He Cys Leu 
185 190 

Ser lie Pro Val Pro Glu Gin Trp 
205 

Thr Thr Ser Val Leu Val Gly Pro 
220 
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Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val 
225 230 235 240 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Tro 
245 250 255 

Val Thr Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe 
260 265 270 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
275 280 285 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
290 295 300 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
305 310 315 320 

Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly 
325 330 335 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
340 345 350 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
355 360 365 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
370 375 380 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Giy Gly Thr Cys Leu 
385 390 395 400 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
405 410 415 

Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 
420 425 430 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
435 440 445 

Trp He Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu 
450 455 460 

Leu Phe Gly Pro Cys He Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
465 470 475 480 

Arg He Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 
485 490 495 

Thr Lys He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
500 505 510 



Asp Val Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala 
515 520 525 
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Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 
530 535 540 



<210> 27 
<211> 15 
<212> PRT 

<213> Homo sapiens 
<400> 27 

Ser Gly Arg Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 
15 10 15 



<210> 28 
<211> 1080 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (1080) 

<400> 28 

acc tct ttt gta gaa aag gca aat gga gtg aag tgc cat aag tac aaa 48 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

ctt tct ttt cat taa gag aca act cac aat tat gta aaa agt gtg att 96 
Leu Ser Phe His Glu Thr Thr His Asn Tyr Val Lys Ser Val He 
20 25 30 

tat gcc eta cag gaa gec ttc aga gtc tac etc cct ate cca gca tec 144 
Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser 
35 40 45 

ccg act cct tec cca act aat aag gac ccc cct tea acc caa atg gtc 192 
Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

caa aag gag ata gac aaa agg gta aac agt gaa cca aag agt gcc aat 240 
Gin Lys Glu He Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

att ccc caa tta tga ccc etc caa gca gtg gga gga aga gaa ttc ggc 288 
He Pro Gin Leu Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 

85 90 95 

cca gcc aga gtg cat gtg cct ttt tct etc cca gac tta aag caa ata 336 
Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin He 
100 105 110 

aaa aca gac tta ggt aaa ttc tea gat aac cct gat ggc tat att gat 384 
Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp 
115 120 125 
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gtt tta caa ggg tta gga caa ttc ttt gat ctg aca tgg aga gat ata 4 32 

Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr TrD Arg Asp lie 
130 135 140 

atg tea ctg eta aat cag aca eta ace cca aat gag aga agt gec acc 480 
Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Aia Thr 
145 150 155 160 

ata act gca gec tga gag ttt ggc gat etc tgg tat etc agt cag gtc 52S 
lie Thr Ala Ala Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 

165 170 175 

aat gat agg atg aca aca gag gaa aga gaa tga ttc ccc aca ggc cag 57 6 
Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Phe Pro Thr Gly Gin 

180 185 190 

cag gca gtt ccc agt eta gac cct cat tgg gac aca gaa tea gaa cat 624 
Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

gga gat tgg tgc tgc aga cat ttg eta act tgt gtg eta gaa gga eta 672 
Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

agg aaa act agg aag aag tct atg aat tac tea atg atg tec acc ata 720 
Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

aca cag gga agg gaa gaa aat cct act gee ttt ctg gag aga eta agg 7 68 
Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

gag gca ttg agg aag cgt gec tct ctg tea cct gac tct tct gaa ggc 816 
Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

caa eta ate tta aag cgt aag ttt ate act cag tea get gca gac att 864 
Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp lie 
275 280 285 

aga aaa aaa ctt caa aag tct gec gta ggc ccg gag caa aac tta gaa 912 
Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

acc eta ttg aac ttg gca acc teg gtt ttt tat aat aga gat cag gag 960 
Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

gag cag gcg gaa cag gac aaa egg gat taa aaa aaa ggc cac cgc ttt 1008 
Glu Gin Ala Glu Gin Asp Lys Arg Asp Lys Lys Gly His Arg Phe 
325 330 335 

agt cat gac cct cag gca agt gga ctt tgg agg etc tgg aaa agg gaa 1056 
Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 
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aag ctg ggc aaa ttg aac gcc taa 1080 
Lys Leu Gly Lys Leu Asn Ala 

355 360 



<210> 29 
<211> 20 
<212> PRT 

<213> Homo sapiens 
<400> 29 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His 
20 



<210> 30 

<211> 63 

<212> PRT 

<213> Homo sapiens 

<400> 30 

Glu Thr Thr His Asn Tyr Val Lys Ser Val He Tyr Ala Leu Gin Glu 
15 10 15 

Ala Phe Arg Val Tyr Leu Pro He Pro Ala Ser Pro Thr Pro Ser Pro 
20 25 30 

Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val Gin Lys Glu He Asp 
35 40 45 

Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn He Pro Gin Leu 
50 55 60 



<210> 31 
<211> 79 
<212> PRT 

<213> Homo sapiens 
<400> 31 

Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly Pro Ala Arg Val His 
15 10 15 

Val Pro Phe Ser Leu Pro Asp Leu Lys Gin He Lys Thr Asp Leu Gly 
20 25 30 

Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp Val Leu Gin Gly Leu 
35 40 45 

Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp He Met Ser Leu Leu Asn 
50 55 60 

Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr He Thr Ala Ala 
65 70 75 
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<210> 32 
<211> 21 
<212> PRT 

<213> Homo sapiens 
<400> 32 

Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val Asn Asd Arg Mer Thr 
1 5 10 ^ 15 

Thr Glu Glu Arg Glu 
20 



<210> 33 

<211> 142 

<212> PRT 

<213> Homo sapiens 

<400> 33 

Phe Pro Thr Gly Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asd 
1 5 10 15 

Thr Glu Ser Glu His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys 
20 25 30 

Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser 
35 40 45 

Met Met Ser Thr He Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe 
50 55 60 

Leu Glu Arg Leu Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro 
65 70 75 80 

Asp Ser Ser Glu Gly Gin Leu He Leu Lys Arg Lys Phe He Thr Gin 
85 90 95 

Ser Ala Ala Asp He Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro 
100 105 110 

Glu Gin Asn Leu Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr 
115 120 125 

Asn Arg Asp Gin Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp 
130 135 140 



<210> 34 
<211> 29 
<212> PRT 

<213> Homo sapiens 
<400> 34 

Lys Lys Gly His Arg Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp 
15 10 15 
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Arg Leu Trp Lys Arg Glu Lys Leu Gly Lys Leu Asn Ala 
20 25 



<210> 35 
<211> 685 
<212> PRT 

<213> Homo sapiens 
<400> 35 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Aia Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Xaa Glu Glu Gly 
20 25 30 

Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

Ser Asn Ser Pro Ser Leu Asd Thr Ser Trp Glu Gly Pro Tyr Pro Vai 
50 55 60 

lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

lie His His Thr Xaa Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu 
85 90 95 

Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Xaa Leu Lys Ser Xaa 
115 120 125 

He Pro Met Ala Leu Pro Tyr His He Phe Leu Phe Thr Val Leu Leu 
130 135 140 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

He Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro 
210 215 220 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 
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Lys His Val Lys Glu Val He Ser Gin Leu Thr Arg Vai His Gly Thr 
260 265 270 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Giu Thr Leu 
275 280 285 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp He Cys Leu 
305 310 315 320 

Pro Leu Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp 
325 330 335 

Asn Asn Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

Leu Val Ser Asn Leu Glu He Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp 
370 375 380 

Val Thr Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe 
385 390 395 400 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 415 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu 
420 425 430 

Gin Asp Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val 
435 440 445 

Pro He Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly 
450 455 460 

Thr Gly He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 490 495 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 520 525 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
530 535 540 



Thr Glu Lys Val Lys Glu He Arg Asp Arg He Gin Arg Arg Ala Glu 
545 550 555 560 
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Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trn Met Pro 
565 570 ' 575 

Trp lie Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu 
580 585 590 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 600 605 

Arg lie Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 

610 615 620 

Thr Lys lie Tyr Arg Arg Pro Leu Aso Arg Pro Ala Ser Pro Arg Ser 
625 630 * 635 640 

Asp Val Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala 
645 650 655 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Xaa Ser Gly Arg 
660 665 " 670 



Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys Xaa 
675 680 685 



<210> 36 
<211> 360 
<212> PRT 

<213> Homo sapiens 
<400> 36 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val He 
20 25 30 

Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro lie Pro Ala Ser 
35 40 45 

Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

Gin Lys Glu He Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

He Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 
85 90 95 

Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin He 
100 105 110 

Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He Asp 
115 120 125 

Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp He 
130 135 140 
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Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Aia Thr 
145 150 155 160 

lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 
165 170 175 

Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly Gin 
180 185 190 

Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp lie 
275 280 285 

Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg Phe 
325 330 335 

Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 



Lys Leu Gly Lys Leu Asn Ala Xaa 
355 360 



<210> 37 
<211> 26 
<212> ADN 

<213> Homo sapiens 
<400> 37 

ggaccataga ggacactcca ggacta 26 

<210> 38 
<211> 25 
<212> ADN 

<213> Homo sapiens 
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<400> 38 

cctcagtcct gctgctggat catct 



25 



<210> 39 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 39 

cctccaagca gtgggaggaa gagaatt 27 



<210> 40 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 41 
<211> 30 
<212> ADN 

<213>. Homo sapiens 
<400> 41 

ggaagaagtc tatgaattat tcaatgatgt 30 



<210> 42 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<210> 43 

<211> 27 

<212> ADN 

<213> Homo sapiens 

<400> 43 

gccttcagaa gagtcaggtg acagaga 27 

<210> 44 
<211> 25 
<212> ADN 

<213> Homo sapiens 



<400> 40 

ccttccctgt gttattgtgg acatcatt 



28 



<400> 42 



gggacacaga atcagaacat ggagatt 



27 



<400> 44 

gagcctccaa agtccacttg cctga 



25 
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<210> 45 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 45 

gatttcagta tctactagtc tgggtagat 29 



<210> 46 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<210> 47 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 47 

ccaagacagc caacttagtt gcagacat 28 



<210> 48 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 49 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 49 

gcaatactac atacacaacc aactcccaa 29 



<210> 50 
<211> 26 
<212> ADN 

<213> Homo sapiens 



<400> 46 

ctaggaaatc cagctagtcc tgtctca 



27 



<400> 48 

ggacgctgca ttctccatag aaactctt 



28 



<400> 50 

gggggaggca tatccaacag ttagta 



26 
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<210> 51 

<211> 30 

<212> ADN 

<213> Homo sapiens 

<400> 51 

ccatctacac tgaacaagat ttatacactt 30 



<210> 52 

<211> 28 

<212> ADN 

<213> Homo sapiens 



<210> 53 
<211> 31 
<212> ADN 

<213> Homo sapiens 
<400> 53 

cgaatacaac gtagagcaga ggagcttcga a 31 



<210> 54 

<211> 28 

<212> ADN 

<213> Homo sapiens 



<210> 55 

<211> 27 

<212> ADN 

<213> Homo sapiens 

<400> 55 

gcgtagtaga ggttgtgcag ctgagat 27 



<210> 56 

<211> 27 

<212> ADN 

<213> Homo sapiens 



<400> 52 

aatgccagta cctagtgcac ctagcact 



28 



<400> 54 

agcccaagat gcagtccaag actaagat 



28 



<400> 56 

cccttaccaa gagtttctat ggagaat 



27 



<210> 57 
<211> 27 
<212> ADN 



<213> Homo sapiens 
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<400> 57 

accgctctaa ctgcttcctg ctgaatt 27 

<210> 58 
<211> 420 
<212> PRT 

<213> Homo sapiens 
<400> 58 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val lie 
20 25 30 



Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro Ile\Leu/Pro Ala 
35 40 45 

Ser Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met 
50 55 60 

Val Gin Lys Glu lie Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala 
65 70 75 80 

Asn lie Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe 
85 90 95 

Gly Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin 
100 105 110 

He Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr He 
115 120 125 

Asd Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp 
130 135 140 

lie Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala 
145 150 155 160 

Thr He Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin 
165 170 175 

Val Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly 
180 185 190 

Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu 
195 200 205 

His Gly' Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly 
210 215 220 

Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr 
225 230 235 240 

He Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu 
245 250 255 
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Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asd Ser Ser Glu 
260 265 * 270 

Gly Gin Leu He Leu Lys Arg Lys Phe He Thr Gin Ser Ala Ala Asp 
275 280 285 

He Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu 
290 295 300 

Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin 
305 310 315 320 

Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg 
325 330 335 

Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lvs Arg 
340 345 350 

Glu Lys Leu Gly Lys Leu Asn Ala Xaa Xaa Gly Leu Leu Pro Val Arg 
355 360 365 

Ser Thr Arg Thr Leu Xaa Lys Arg Leu Ser Lys Xaa Lys Xaa Ala Ala 
370 375 380 

Pro Ser Ser Met Pro Leu He Ser Arg Glu Ser Leu Glu Gly Pro Leu 
385 390 395 400 

Pro Gin Gly Thr Lys Val Leu Xaa Val Arg Ser His Xaa Pro Asp Ser 
405 410 415 

Ser Ser Arg Thr 
420 



<210> 59 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 59 

taaactacaa atggttcttc aaatggagcc ca 32 

<210> 60 

<211> 32 

<212> ADN 

<213> Homo sapiens 

<400> 60 

gatgcagtcc aagatgcagt ccatgactaa ga 32 

<210> 61 
<211> 1740 
<212> ADN 

<213> Homo sapiens 
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<400> 61 

aggttggctg acaaccgctc ttaactgctc 
gcagttgaga tttccttggg aggggtgcct 
gcaggccagt ccaggggtcc gcggtagatc 
tgaagaacca tttgtagttt tacagcttcg 
ttaaagatac aaggattgaa atgtacggcc 
tgcaagtggg gtttccttta gaaaaactcc 
gccacattct ccatagaagc tctcggtaag 
ggggtgcagt gagagtgaaa gggggtaaga 
gggccaagag gatctacgat; tctagttact 
gcagatcctc tagaggttca caggaatagc 
ttggcagtat ccagggtttg gctcgagtgt 
aactgcggtt agggtagata aaatgactgg 
tggggaatta aaggggaagg gacttgacta 
ttccctcctc tcagggacag gttccctgta 
aggaggtgat gtctgcaact aagttggccg 
ggaagggctg tccatacagc atctcatatg 
ggattcttag taaggctata ggcaacagag 
gcttttttag atgtcgtttg agtgtttcat 
gcctccaggc acagtgtaag tgatattgta 
ctgcagcctt gaaattgggg ccattgtcac 
gaattatttc atgaattagt acttttatta 
aggcctccac ccaaccagtg aaagtaccca 
gggcatgtgg gtaaaatcta gttgctagtc 
tcctgaagga gcttggcaat aaggcagggg 
gactatctgc ttgacagttt tgaaaaggcc 
atgggtgctg tcaatgccta agtgaaaggt 
gttagctgca ggcaaaagta ttttttcttt 
atgtcctcgt gagtttcccc attccatttc 
gaggggatta ccccatacta ggggtccttc 



catgctgaat tggggcatag taggggtcgt 60 
tcaatgtcat caacattgga gcatgggcta 120 
ttagtcatgg actgcatctg gggctccatt 180 
attctggaag agacaaacgt aacaaggagg 240 
tgaagtgcag gggcatatga gtgtgggcgg 300 
gatacaatag ggcatcaata tttctaggaa 360 
gggagctact ggtagtacag cagcatacag 4 20 
gaacagtaaa aagaaaaata tgacaaggga 480 
ttcctcacgg ttgtcgcctg aagagcaggc 540 
tagcattgtc tgctggattc tcgggttcct 600 
gacttatcca agactccact ccagccactt 660 
gtagggtcct tcccaggatg tgtgtaggga 720 
ataccatgtc accagggtgg aataattcct 780 
atgttttaag aactcgttga tatttggcta 840 
tctctcagtc aagcacaagg tcattggtta 900 
gactaagtcc tgctttttgg ggacagtttc 960 
caggccatgc aaggtgggtt tcttgggtta 1020 
tcattttctc aacttttcct gaggatcgtg 1080 
tacctaacgc ctgggatacc ccctgcgtta 1140 
tctgtaaacc tcagggaagt ccgaatctgg 1200 
cctcttgggc cttttctgtc ctacaaggga 1260 
gattagtaga tactgaaatc tctgagattt 1320 
ttctcctggg taatggcctg ttctttgttc 1380 
attatttctt tggcacactt cacaggccct 1440 
tggtccagta aataatgatt tggccatctg 1500 
ctggtgaagg gttttaagta atttccattg 1560 
ggtggctggc catcctgagg agaggaaact 1620 
ttctgctgag tactggagct tggtttccca 1680 
tgtaagcatt tctaatggag agtcctgcct 1740 



<210> 62 
<211> 7140 
<212> ADN 

<213> Homo sapiens 
<400> 62 

ttggtcttaa gaacacaaat gatatggctc 
tctcacgctg atttagataa aacgactgtc 
ccctgtgacc tgcacgtata catccagatg 
gtgaaaatgg cctgttcctg ccttaactga 
cccatcttaa ctgagcgatt aaccttgtga 
actgagcacc ttgtgacccc cgcccctgcc 
ttccactacc cacccaaatc ctataaaatg 
tttttcggac tcagcccgcc tgcacccagg 
gcctgtttgg tggactctct tcacacggac 
taggaggact ccttcaggag accagtcccc 
acctacaacc ttgggtcctc agaccaacca 
aggtaagcag tcttttcact ctcttctcca 
ctcactaccc ttcaatctcc ctgtccttcc 
acaaaggaga cacattttat ccatggaccc 
agacagtctt cccttggtgt ttaatcactg 
ctccattggt gtctgatcac ggtggggaca 
ggtggtacgt caactgcaaa agcaggggac 
tctgtgtctc tacctttctc tttaaactta 
ccattccccc ttcttctccc ttagcctgtg 



caatgactgg aggaacacca gggtccttgg 60 

aggcctctga gcccaagcta agccatcctc 120 

gcctgaagta accaaagaat cacaaaagca 180 

tgacattcca ccattgtgat ttgttcctgc 240 

aattccttct cctggctcaa aacctccccc 300 

cctaagagaa aacccccttt gattataatt 360 

gccccacccc tatctccctt cgctgactcc 420 

tgaaataaac agccttgttg ctcacacaaa 480 

gctcatgaca tttggtgcca aaacctggga 540 

tgtccttgcc ctcactctgt gaggacatcc 600 

gcccaaggaa cagctcacca atttcaaatc 660 

gcctctcttg ctacccttca aactccctct 720 

aattccagtt ctttttcatc tctagtagag 780 

aaaactccag caccagtcac ggacttggga 840 

cggggacgcc tgcctgatta ttcacccaca 900 

cctgccttgg tcactcaccc acattccctt 960 

gcctgctttg gctgctcacc cacccccttc 1020 

cctccttcac tatgggcaaa cttctgccct 1080 

ttcttaaaaa cctaaaacct cttcaactca 1140 
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cacctgacct aaaacctaaa tgccttattt 
aacttgataa tagctttaaa tggccagaat 
atctagataa tttttgtgga aaaatggaaa 
tcttctacac attggtccct ccctagtctc 
cttctttctc tcctgtctgt tccttcagtc 
tcctttgcta cagacccatc tgaactctcc 
gagccaggtc ccaattcttc ctcagcctct 
tcctctcctc acactcagtc cggcttacag 
gcccaacaat ttcctcttaa agaggtggct 
cctttttctt tatctgacct ctcccaaatc 
ataaaaaccc agccagttca tggcccatct 
agaccctgaa gggtcagaag gccgtcttat 
tcccaacatt aaataaagct ccaaaaatta 
ttaattaacc tcacttcaag gtgtacaaga 
tttgagttgc aattccttgc ctcaactctg 
aagaacttca aaacacctga actgcagcag 
ggatcttgct tcaagtgccg gaaatctgac 
attcctccta agccacgtcc catttgtgca 
cacccggcag ccaatcccag agcccctgga 
ttcccagatc ttctcggctt agcagctgaa 
ccctggacca tcacggatac tgagcttcag 
ccctgtttaa tcgatacagg ggctacccac 
tccctttccc ccataactgt tgtgggtatt 
cccccactct ggtgccaact tggacaacat 
acctgcccag ttcccttatt aggccgagac 
attcctgggc tacagccaca tctccttgcc 
tatcttcctc tcatatcccc ccaccttaac 
ctggcaaccg atcacacgcc cattactatc 
caatgccagt atcccatacc acaacaggct 
ctgctacagc acgggcttct aaaacctata 
gtctaaaaac cagataagtc ttacaggtta 
gttttgccta tccaccctgt agcacccaac 
cccacaactc actattccgt tcttgatctt 
ccctcatccc agcctctctt tgcttttacc 
cagcttacct gggctgtact gccgcaaggc 
gctctttctc atgatttact ttctttccac 
gatgaccttc tactttgtag cccctccttt 
cttcaacatt tgttctccaa aggatatcgg 
ccatctgtta catacctcgg cataattctt 
tgcgtctcca actgatctct caaatcccaa 
tcctaggcat ggttggatac ttttgccttt 
cattatataa actcacaaaa ggaaacctag 
actcctcttt ccattccttg aagacagctt 
tctcatccca acccttttca ttacacacag 
ttacacaagg accgggacca tgccctgtag 
ttttaggctc gccatcatgt ctccatgcgg 
ccctcaaaat cacaaactat gctcaactca 
tattttcttt ctcacacctg acgcatatac 
cactctttgt tgagtctccc acaattacca 
cccacattat tctggatacc acacctgacc 
cattcacccc atttccccat atttccttct 
ttactgacgg cagttccacc aggcctgatc 
tagaatcttc cacatccatc attgaggcta 
aagccgaact gattgcctta actcgggcct 
tttatactga ctctaaatat gccttccata 
aaagaggttt cctcactacg caagggtcct 
ttctcaaggc tgctttactt ccaaaggaag 
aggcgtcaga tcccattact ctaggaaatg 



35 

tcttctgcaa cactgcgtgg ctgcagtaca 1200 
atggcacttt caattcctcc atcctacaag 1260 
aatggtctga gatgcctgac gtccaggcat 1320 
tgctcccaat gcgactcatc ccaaatcttc 1380 
tccaccccaa gctctgagtc ctttgaatcc 1440 
cctccccccc aggctgctcc tcaccaggcc 1500 
gctcccccac cctataatcc ttttatcacc 1560 
tttcgttctg tgactagccc tcccccatct 1620 
ggagctaaag gcatagtcaa ggttaatgct 1680 
agttagcgtt tacgctcttt ttcatcaaat 1740 
ggcaacaacc cttacaggct ttacagccct 1800 
tctcaatatg cattttatta cccaatccgc 1860 
aattctggcc ctcaaacccc acaacaggac 1920 
atagagtaga ggcagccaag tagcaacgta 1980 
agagaaaccc cagccacatc tccagcaaac 2040 
ccaggcgttc ctccaggacc acctccccca 2100 
cattgggcca aggaatgcct gcagcccagg 2160 
ggaccccact ggaaatcgga ctgtccaact 2220 
actctggccc aaggctctct gactgactcc 2280 
gactgacact gcccgatcac ttcagaagtc 2340 
gtaactctca cagtggaggc taagtccatc 2400 
tccacatcac cttcttttca agggcctgtt 24 60 
gacggccaag cttcaaaacc ccttaaaact 2520 
tcttttatgc actctttttc agttatcctc 2580 
attttaacca aattatctgc ttccccgact 2640 
gcccttcttc ccaacccaaa gcctccttca 2700 
ccacaagtat gggacacctc tactccctcc 27 60 
ccattaaaac ctaatcaccc ttaccctgct 2820 
ttaaagggat tgaagcctgt tatcacttgc 2880 
aactctccat acaattcccc cattttacct 2940 
gttcagaatc tgcaccttat caaccaaatt 3000 
tcgtacactc ttttgtcctc aatgccttcc 3060 
aaagatgctt ttttcactat tcccctgcac 3120 
tggactgacc ctgacaccca tcagtcccag 3180 
ttcagggaca gccctcatta cttcagccaa 3240 
ctctctgctt ctcaccttat tcaatatatt 3300 
aaatcttctc aacaagacac cctcctgctc 3360 
gtatccccct ccaaagctca aatttcttct 3420 
catgaaaaca catgtgctct ccctgccaat 3480 
cctcttctac aaaacaacaa ctcctttccc 3540 
ggatacctgg ttttgccatc ctaacaaaat 3600 
ctgaccccat agattctaaa tcctttcccc 3660 
tagagactgc tcccacacta gctctccctg 3720 
ccgaagtgca gggctgtgca gtcggaattc 3780 
cctttttgtc caaacaactt gaccttactg 3840 
tagcttccgc tgccctaata cttttagagg 3900 
ctctctacag ctctcacaac ttccaaaatc 3960 
tttctgctcc ccggctcctt cagctgtatt 4020 
ttcttcctgg cccagacttc aatctggcct 4080 
ctgatgattg tatgtctctg atctacctga 4140 
tttctgttcc tcatgttgat cacatttggt 4200 
gccactcacc agcaaaggca ggctatgcta 4260 
ctgctctgcc cccctccact acctctcagc 4320 
tcactcttgc aaagggacta cacgtcaata 4380 
tcttgcacca ccatgctgtt atatgggctg 4 440 
ccatcattaa tgcctcttta ataaaaactc 4500 
ctggagtcac acactgcaag ggccaccaaa 4 560 
cttatgctga taaggtagct aaagaagcac 4620 
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ctagcgttcc aacttctgtc cctcatggcc agtttttctc cttcccatca gtcattccca 4 680 
cctactcccc cattgaaact tccgcctatc aatctcttct cacacaaggc aaatggttct 4740 
tagaccaagg aaaatatctc cttccagcct cacaggccca ttctattctg tcatcatttc 4800 
ataacctctt ccatgtaggt tacaagccac tagtccacct cttagaacct ctcatttcct 4860 
tccatcgtgg aaacatatcc tcaaggaaat cacttctcag tgttccatct gctattctac 4920 
tacccctcag ggattgttca ggccccctcc cctccctaca catcaagctc ggggatttgc 4 980 
ccctgcccag gactggcaaa ttgactttac tcacatgccc tgagtcagga aactaaaata 504 0 
cctcttggtc tgggtagaca ctgtcactgg atgggtagag gcctttccca cagggtctga 5100 
gaaggccact gcagtcattt cttcccttct gtcagacata attccttggg ttggccttcc 5160 
cacctctata cagtccaata acggagcagc ctttattagt caaatcacct gagcagtttt 5220 
tcaggctctt ggtattcagt ggaaccttcg taccccttac tgtcctcaat cttcaggaaa 5280 
ggtagaatgg actaatggtc ttttaaaaac acaccccacc aaactcagcc tccaacttaa 5340 
aaaggaggat agagcccaaa aactcgcaac caagctagta attatgctga acccccttgg 54 00 
gcactctcta attggatgtc ttaggtcctc ccaaatctta gtcctttaat atctgttttt 54 60 
ctccttctct tattcggacc ttgtgtcttc cgtttagttt ttcaattcat acaaaaccgc 5520 
atccaggcca tcaccaatcg ttctatacaa taaatgctcc ttctaacaac cccacaatat 5580 
cgccccttac cacaaaatct tccttcagct taatctctcc cactctaggt tcccatgccg 5640 
cccataatcc ctctcgaagc agccctgaga aacatagccc attatctctc cataccaccc 5700 
ccaaaatttt tgctgcccca acacttcaac actattttac attatttttc ttattaatat 5760 
aagaagacag caatgtcagg cctctgagcc caagccatca tatcccctgt gacctgcaca 5820 
tatacatcca gatggcctga agtaactgaa gaatcacaaa agaagtgaaa atggcctgtt 5880 
cctgccttaa ccgatgacat tccaccactg tgatttgttc ctgccccacc ttaactgagc 5940 
aattaacctt gggaaattcc ttctcctggc tcaaaacctc ccccactgag caccttgtga 6000 
cccctgcccc tccactaccc acccaaatcc tataaaatgg ccccacccca tctcccttag 6060 
ctgactcctt ttttggactc agcccgcctg cacccaggtg aaataaacag ccttgttgct 6120 
cacacaaagc ctgtttggtg gactctcttc acagggacgg gggtgacaac aacacggaca 6180 
cacatggagt ggttttaagg agcagagagt ttaatacgca aaaaagaagg aagaggctcc 6240 
cctgtacaga cacagaggga gggggctcca agccgagaga aggaaacccc atgtgcagtg 6300 
gaaaagtggt tgattatact gggaggctgg aggaggcggt gtctgatttg cacagggccc 6360 
aggggattgg gttgaccagg tgtatcattc atgtaccccg caaaaaacct ggccctccca 64 20 
cctcagccct ttaatatgca aatgtgggtt gccatgatgt tctgaaaaca catgaattat 6480 
ctggaggggg ccatgacact tggtacatgt gctgacaaga agagggtggg aatcgccatg 6540 
gtggccatgt tgggtggacc tagtttttaa tagcctgcat ttgcatatca aagtttgctg 6600 
gcctggctct ttaagctgtc ttttctgtta gaaaaggaat ggtttggaat gggtgagggt 6660 
tgcttcttat tacaagaaaa tttccaaaaa cctttactct ttctagctgc caaaaaacta 6720 
tttcttaata acttatgtat taccataatt aggcagcacc aaagatccct gcaggtcaga 6780 
ccactgcaat taacatgctg gctttactgc tgattatggt agctgcatcc acctagcctc 6840 
tcatattgca actgcctgac ctctgccacc ccacgagcca cttatcccca cttataatca 6900 
gcccatttcg attgtaacat ctgccactta ttcccgacgt tgtggtatat cctatagatg 6960 
aattcattca acatccattc caacaccacc tctcttgcct tcctatactc tctggagagt 7020 
gaattactga gtcacatgat cttcactgca gtcatttgtg gctatgtgac atagttctgg 7080 
acagtgaaca tagacagaag tccctggggc gggcttcctt tctgggatga gggcaaaacg 7140 



<210> 63 
<2U> 44100 
<212> ADN 

<213> Homo sapiens 
<400> 63 

tgcctttatt tccgtaggct ggtcatatgg cgctagcact cacataaagc taccgaggag 60 
agcgaatgaa accaaaatca ctttaccttc acagcacgag gccgtcgtcc ctctcgatat 120 
ttggcccgtg tgtcgcatac cgccctctgg acgtggtgat caaataaact ccctagctcc 180 
ccgccgctcg acgccatctt gcctactttg atcctcgcag ggaggacaac atccgcccta 240 
ctgagctccc ttttatccaa taagagagcg ggatgagtta aggagtgcca ggattggctg 300 
gagaatcgac agcgtcggcc atcgtttcct gcgtgcgaag atttgatgaa cgaggtgccg 360 
cccccgagcg gctcggcgga gaggcgcggt gggtgacaga agctttcttg tcccacccac 420 
tacaggctta cggcaggatg cgcagcgggg agagggggcg gggccgcagg gggcggggcc 4 80 
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gatcgatctc ctccggctcc gacgtcctcg 
tagggtgggc gaacccagag cgacgctccg 
gtgctggggg aggcggggcg gcagtgactc 
tccacctgcc gcggcgtctc gtggcccagc 
gagccacctg atcttcagcc tggggtcgga 
gacaccggct gccacccggg cgccgccgaa 
gggcccttct gggtagtctc tggatcccac 
cccaggtctt ttcacttggt gaaactgaac 
tttataaata ttccttattc caggctggaa 
ttttaaaagg tgttttcctt gccagccatt 
ccgcgagagc gggacgcaga gttgttggcg 
ccgcgtccca tgagcgggaa aggttaatac 
ggaacacagc tgtagtgtgt taggaacaca 
gatcagtcgc ccttctggac gttgtggtta 
gatacagcgt ccatattttc ataattaaaa 
gtacttatgg gggcaaaagg acggcgtatt 
acccaccagt ggctaatcta tgcaatgaat 
tttccacttg agttacttcc ccatacctag 
gagttcagca gaatcctcct atcatcgtcg 
ttttggtttt tgatgggctt tatggctaga 
gtagaagttg gttcagtgct ctgtcagctt 
tgcacttaat agtaggaatg ctttcttaca 
gttaccttac attcatcact gtttaagaat 
gagccttcgg gaagtactta taagaattaa 
ctttagccct ggaacaaatt gctgtttctg 
ttactttcta attatcaatg taataagttt 
tttattcctc gatgaattat ataaatttat 
gcatggaaaa ttattaacaa gaaaataagt 
aatgttgaca gtttggatca aatcttccag 
atgaggtcct gtatacacac gtacagtttt 
tgagtgtttt attttgttaa aaggtcatca 
aatttgccat aatttattta attgtttact 
ttaggcatta gaagtgataa actatatttt 
ttagaaaaca tcattttatt tctggttgtc 
aggccataga taattatgaa agcagaaaga 
ctttatttgg ggtgaagcat tgagtgcata 
ttggaacaat ggttttctgg cctatgtcag 
gttctgatca accctcagac ctattaaatc 
gcatctctaa ttttaaaaaa tttattcagg 
actgtcctag aatcatagaa ttttaatgac 
tgtactttta catgtaagga aactggcatt 
tttgccctct tgtctatagc tcactctgca 
ctataaccaa tctccttccc acttctgttc 
ttttcttcct tccatacaaa ttccatgtct 
tagctttcca attctctgtt gcccacattt 
atgtgacaca tcacatttga tatactctgt 
tactcaagtc attatttcag gactgactac 
accttggcac tgttgacatt ttgagctgga 
attttaagat gtttaacagc acccttggcc 
cctatctgtg acaaccaaaa aggtcttcag 
tcacctctgg ttgagaacca ccgcttcaac 
tgtgattgca gcagggggag aggattcata 
ccattcggat atggccacac aattttcatt 
tttggacctg attattccta aggcattctg 
aatactgata cctcagtttg ggtcaaagaa 
cctggaaaag acgctccttt ctagctgtct 
tctgtggttc aagtgaagta ttttgacata 
tttgctcaat ataactgagc acatattgtg 
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gcctgccggg tcccgggtcc tttgcggcgc 54 0 
ggacgatgtg gggcagcgat cgcctggcgg 600 
cggccttcac caacgctcgc gaccccttcc 660 
tgcatctgct gcaggtaacc tgcccgcccc 72C 
cgaggccgaa gcctctcagg gacgcggcgg 780 
gcgcgcagag atcagggtcc ctcgacggca 84 0 
aagtccagtg cagccctggg ctcgtcttat 900 
ccagaaacgt cctaatattc taccactgtt 960 
aagctcctga gaagtggtrt gtttttatca 1020 
tccagttaac ctgcgctgct gccgtccggc 1080 
gagcccctgt cggttccccg ggactaagca 1140 
aatgatggtt ctgccctgcg tcgctgacgc 1200 
taacgtagtt aagatcactt gaagctctgc 1260 
ggatgtttca cagttctaac cactggtgga 1320 
atagaggcac atggtctcac gagttcgagt 1380 
tgaaatcctc ataaatcctg gatgcatggt 14 4 0 
agagtttgca ataatttcaa gcatcccttc 1500 
gggaagatat ttttggtcca ctgaaaacat 1560 
ttattattct ttaccactaa gtagacaatc 1620 
gacaaatcag tcactgtcac caagttccag 1680 
cgatgggatt tttcaacatg ttttcaaacc 1740 
gtaactctaa tttgatccua agatgtagtt 1800 
ttagtggtct tgatctttgt tttaaatttt 1860 
ttcatgcata tctttttgaa atgtaaatgt 1920 
ttcagcccat attagcagaa taggtcaact 1980 
attactttat agattccaca aatctataca 20.40 
agaatttatg trttatagaa aatttggaaa 2100 
tacccataat cccagaactt agaggtgact 2160 
ttttgtttct aatctttatt tttaacataa 2220 
gtgtcctggt gtttttattt aatgttatta 2280 
ttttaagttg ttaattagta ttctagcaca 2340 
atgattgacc atttagattg tacttaattt 2400 
aatcagacgt tgaaaataac acatctttgt 24 60 
taggatagat tcccagaatt cttgggttag 2520 
ttcacaagtt gggagttaat acttgaatta 2580 
atacagatca tgcagtaatg ggaagaaggg 264 0 
acttaccttg aagcttttaa gaatacagat 2700 
agacctaaaa tcttagggaa taggctttag 2760 
ctacttggat gcacaaaaga gttgagacct 2820 
gatagagacc ttaagcatct aggtcgtttc 2880 
cctaggccag taccattgcc atgcagctaa 294 0 
tcacccaacc taccgttctc actgtttctt 3000 
tcttactcat gccattcttc cctcagtcat 3060 
ttaaaaagga ataatcctac ctcctccaca 3120 
gtctcccttt caatacttct ctgttgtgtt 3180 
actgtgtttc aagtattgta ttctcttgtt 3240 
ccagtagatg ctttaagtca ggatttctca 3300 
taattttttg ttttgggggc tctcctgtac 3360 
tctatccagt agacgcctgt actgcctccc 3420 
acattgtcag atgtctactg aaggacaaaa 3480 
taagttatct tctctgtact cagaacttga 3540 
tacacagtga atgcaaacga acctaaatca 3600 
tcccttgtgt tagcaagaga taccctaggc 3660 
atgtatggtt ttacctgcag atttcctggt 3720 
ggtcaattaa ttgattgatt tgatttgact 3780 
ctttcttctc tttacctgaa tagccagggc 3840 
aaaattaact tagaacattg gtctgcagag 3900 
gctttatgga gctggttact actttttgac 3960 
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caaataaata 
gagctggtag 
gtttcctcat 
atagaaagca 
gatatggtaa 
tttgtcagcc 
gtgatacatg 
acgttatatt 
cataagctgg 
cagatcacct 
tactaaaaat 
gaggctgagg 
gtgccactgc 
aaaagcaaga 
gagactgagg 
ttgccactgt 
gcatgtaaat 
atgtagatct 
tgtctcagtc 
ttttaactt-a 
taataagtct 
ggcactatca 
gcttcctgag 
tattattgat 
atggtggctc 
gaccaggagc 
aaatggctag 
aggattgcta 
cagcctgggc 
gatgcaatat 
aaaaacttgc 
tcttgtttgt 
cgaggtctct 
gccacaaact 
gcttttttaa 
ataatataac 
gacatggctt 
ttcttccaat 
aattctaaaa 
tatgttaaaa 
acagtctcaa 
ttttttcttt 
ctatttaagt 
ataatgctgc 
ttggaaatga 
tagaactctt 
aatgtatacg 
gtggtctgga 
gggggacagg 
atagaaataa 
gtatgctatt 
ttatcttgta 
cacatcccct 
tactattatt 
aaaataaaaa 
ccaaggtggg 
accccccctc 
cccagctact 



attagaagta 
agttcccttt 
atgaagtaga 
tctggggctt 
cttaagactt 
agaacagttg 
atgatggctc 
gtcccagaag 
ctatggtggc 
gaggtcagga 
acaaaaatta 
caggagaatt 
cctccagcct 
aacataaaga 
tgggaagatc 
actcgagcct 
gaatgaattt 
tgccatgttg 
tcccaaagta 
atgaatttat 
ttttgtgtgt 
tggctcactg 
tagatgggac 
acatattaat 
atgcctgtaa 
ttaagaccag 
gtgtggtggt 
gagcccagga 
aacagagcaa 
aagtagtgga 
acatagagaa 
ggagagaata 
ataatgagtt 
tacatgtttt 
aacctatatt 
gtttctggaa 
cacattttac 
aaataagtaa 
ttatattgct 
tagtaaattt 
gtgttcacta 
gaatcgttaa 
ttattgactg 
cataagaata 
ttatagattt 
tttggacatg 
aaaacctttt 
gtcaccagcc 
taagcacatg 
aattaaaagt 
atgtaactag 
gtttaccata 
aattttggtt 
aaactttatt 
attcagctgg 
cggataattt 
tctactaaaa 
caggaggctg 



ttttccctcc 
tttgatatct 
atttatctgg 
gatcaccttc 
ttgattccaa 
gactgttctg 
tcttaaatat 
tggctccaac 
tcacgcctgt 
gttcgagacc 
gccgggcatt 
gcttgaatct 
gggtgacaga 
ctgggcatgt 
acttgagccc 
gggcaacaca 
gatatttaat 
cccaggctgg 
taaagattac 
tttgatataa 
gtgacgggtt 
tagcctcaac 
cacaggcgta 
aaaattattt 
tcccgacagt 
cctaagcaac 
gtatgcctat 
gtttcaagtt 
aatcctgtct 
aaaggatatt 
aaggattaac 
tcagtagttc 
tgtaattgtt 
aatgtaattg 
cccatagtta 
gggtacagaa 
ccttttgtac 
ataaatatgg 
acatttttaa 
atatcttatt 
tcatagaaaa 
ttgggaataa 
actgctgcca 
taagggtatt 
ttaaa'tgcta 
tgaattgtaa 
ttcctctcat 
tgcattcttg 
tgatggcaat 
ttagattttt 
tctaggatat 
ctccctactt 
tcatgaaatt 
tctgacatat 
gtgcggtggc 
gaggtcagga 
attcaaaaat 
aggcaggaga 



tcaataaggt 
cagggcacct 
attatgtatt 
attcttgtaa 
atctaggcaa 
tgaaaattgt 
aaaattgtaa 
attgtttgaa 
aatcccagca 
agcctggcca 
tggtgggggc 
gggaggtgga 
gtgagtctcc 
tggctcatgc 
aggaggttaa 
gtgagatcct 
attttaaatt 
ctttgaactt 
acatgtgagc 
ataaattaat 
ctcactctgt 
ctccctgact 
tgccaccaca 
ttattttaaa 
ttgggaggcc 
atagtgagat 
attcccagct 
acagtgacct 
caaaaaaaaa 
aaattgtgcc 
aagaaataga 
atttgtttcc 
taatcataga 
cttttttaat 
tatgagccct 
gaaacagcag 
gttttgtgct 
attgtatact 
agatgatatg 
taataatttc 
tactgcacag 
atgctcaaat 
ttttgaattc 
ggcttcatta 
caacaaatgt 
taatagttta 
ttcttatatg 
agctgggtgg. 
aactttcttc 
tgttaaagga 
tgaagctgac 
gcttcttatt 
atttttcctt 
tttataacct 
tcacacctat 
gttggagacc 
tagctgggca 
attgcttgaa 



tcatttttcc 
ttcatatttc 
gctgactctg 
tagctcacac 
aatacactca 
gagaaaaat- 
taacatggtn 
atttgtctca 
ct-tgggagg 
acatggtaaa 
ctgtaatccc 
ggttgcagtg 
gtctcaagaa 
ctgtaatccc 
ggctgcagtg 
gtctcaggaa 
atgaaaactg 
ctgggctcaa 
cactgcacct 
aacactgaag 
tgcccagact 
caagtgatcc 
cctggctgat 
aatgatatat 
gaggtgggag 
cccatctcta 
actcaggaga 
atgattgtgc 
aaaagttcga 
tatatgaaca 
ccaaattgtt 
ttccaagttt 
aaaccctttt 
gagaataaat 
tacaattatt 
taattacctc 
tttgccacat 
ccatctggtt 
tgtttctact 
cctattgata 
atagcttttg 
agttatatgt 
tgaaggggtt 
gcatccacca 
agataacaga 
ttttcatgtg 
aatagaatca 
aaggcaggca 
taatatcaca 
ggtgagatgt 
tatactctgt 
ctactattta 
ctgaattact 
tccatggtct 
aatcccagca 
agcctgccca 
tggtggcagg 
cctgggaggt 



ttttttcagt 
catctctta= 
atgaaaaccc 
ggttacagc- 
gttgaaagsa 
acacaactaa 
aatttccact 
tttaaagaaa 
crgaggcagg 
accccatctc 
agctacttgg 
agccgagatt 
aaaaaaaaaa 
agcactttga 
agccgtgatt 
aaaaaaaatt 
ttccgtagag 
acaatcctcc 
ggcctaatat 
cttcctgata 
ggagtgraat 
tcccacctcg 
ttttaaaat:: 
gtggctgggc 
gatcacttga 
tagaaaaaaa 
ctgaggtgag 
cagtgcactc 
aaatgcttat 
caactatatg 
cacatggttg 
atatgttttc 
ttggtccttg 
gttatatttt 
aagaggctgc 
tgagaacaga 
gcatttatta 
ggtgtttcat 
tattaacgta 
gacatttaag 
ctatagtttc 
ggctcaactg 
gattaaattt 
gcattgggtg 
gaactatcta 
aatccagaaa 
agctatagaa 
ttttagtgat 
taatatagca 
cacctaattt 
ttttaggtca 
actcattttc 
aggttctact 
cacttgatta 
ctttgggagg 
acgtggtgaa 
tgcctgtaat 
ggaggttgca 



4C20 
4080 
4140 
4200 
4260 
4320 
4330 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4960 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
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gtgagctgag attgcactgc tgcacttcag 
aaaaaaataa aaaataaaaa attctacaac 
cccttatgag tttaatatgt ttagattata 
ttttgttttc ttatgtttat caagttattc 
tgtgaggctg ggctcaatgg cttatgcctg 
gaggaccact tgaggccacg agttcaagat 
atctctataa aaaaattaaa aaaattagct 
ctactcagca gactgaggta ggaggaatgc 
tatgcactcc agcccgggca atagcaagac 
taatacatat tcattataac tattttacca 
cccagtccca tcctcagaat ggggatctca 
attcatattt tctgcaatta ttaccccaca 
aaacaatgtg catttaacat gtctctctct 
tcctctgttg cagccctgcc agtaagacac 
aaagtggact ggctaggcca ggagtcctta 
tttctcagaa tcagatatat atgtggactg 
ctatacgttt aaaacttata tagatggggc 
acaatacacg agagtgccat gtctttttaa 
tgcatgtttt ttgatgagaa taggctactc 
cttgcatact ctaaattgtt gctagaatct 
atcattaact ttggtgcttt gttctacaat 
gcttagcagg ttacagttct gccctctgag 
cttcctgatt ttcaagtctt aattagtact 
tttgctttga agtgacttta cctgattttt 
gaaactgagt ctctagcttc ttggtgggca 
cttttcagta agggagatat tgaagagaaa 
agggaaatcc tgctccagtc cacaaaagca 
aacatgcaga ggctttggat tttactcctt 
aggaagtaag atggtgactc cagcttatag 
aataggaggg tattattagt tttacttaac 
atttgtctcc agtgtctatt tcagtgtatt 
gcaaaacttc tagaaataat gagaatattt 
atagtcattt cttcttatat tttttactta 
tttgaaaaac atgtcatgct gagatgtatt 
gtttttccta aaatgctgag tatatcaagt 
cacatgaaag actacacata tagccaggtg 
caggaggctg aggcaggagg attgcttgag 
attgtaccac tctactccag aatgggtgac 
agaaagatta catagactac atatacaccc 
acctaaaatg gtaagaagat aacttcttat 
taaagtagtt ttaaattttt aattttttct 
tatcttgtca acaagttgag gtggaacccc 
agaaaaccaa ataagaacta tctcatttaa 
tagctttctc taagctttat tatatattct 
gggccaggca cagtagctca tgcctatagt 
attgcttgag tccaggagtt caagaccagg 
taaaaataca aaaattagcc aggcatggta 
ggctgaggca ggagaatcgc ttgagcccgt 
gccattgtac tccagtctgg aaaacagagt 
attgatagag atctaatgta caacctgaca 
catgttaaat gagtagattt taactactct 
gagatgatgt atatgttaat ttacttcact 
tcataacacc atgtcgtgta tattaaatat 
attgagattt tttttaacta gatatggagt 
gtctgttggt tctaggagct gcatgctgtt 
cgaatagttt ttccaaaagc catttttcct 
atccaaattg gtaggtgcta ttgtaatatt 
tccaaagtag aaatgaatgt gcactaatga 
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ccgggtgaca agagcgaaac aacgtcttca 7500 
acagggttat zatztztcca tttttgtttt "7560 
aacctgaaag cttgaatacc tatgtcta-- 7620 
ctttaaacat tttctaaact gtaagaataa 7630 
taatcccagt gctttgggag gccaaggtgg 7740 
tagcctggcc aggcaacata gcaagaccct 7800 
gggcatggna gcaaatgctt gtagtcccag 7860 
ttgagaccac gaatttgagc gacctacgac 7920 
cctatctctc aaaagaagaa gatgtagtaa 7980 
ttgaaagtaa aaaatgagtt tttacctctt 8040 
gtagaccttc aggattggaa gaatgagatc 8100 
aaacatttca gatacctttc catgiattac 8160 
ctctctctct ctctgtgtgc gtcttcatga 8220 
tatctcctga agaatcactg ataggaacag 8280 
gcttcttagg gggcaggagc tgctttgtgc 8340 
aaacatttaa aaacagaata gccaagggtg 8400 
tacattgctc cctattacra atctcccatg 8460 
cttgttttga gcacagacra atcttgttca 8520 
atgagaaatc tgtaaacci:a acactagtcc 8580 
taaaatttta gcaccagacg gaccttagaa 8640 
acaaggagat ggaatatc~t acccaggatt 8700 
tacccagcac ttccctgtgg gcaacatcaa 8760 
ctgaagaatc ctacttgttt ttaactccca 8820 
ttagatccct cattgcagca atgccactaa 8880 
ggagctgctt rgtgcttgct cagaatcatc 894 0 
tctactgagg agtctggggg tgaggcactc 9000 
gagaggaagg gttggttacc tagagtattt 9060 
taatccttgg aaatgcctar ggaaggggaa 9120 
acatactagt gttacatata tttaaactat 9180 
tttcaactgt gaaggattat acttctcaat 9240 
tttcactttt cttgaagcag catgtctgtt 9300 
atatattaga tcaagccata acttgatgat 9360 
catttttaca ttttaatgat tactttcatt 9420 
tttcttcatt ctgtaattag ttatgaaaca 9480 
cttggctaag aataagtaat aaatatttgc 9540 
cagtggcttg cacctgtttt cccagctacc 9600 
cccagggttt ccaggctgca gtgaactatg 9660 
agagccaggc cccatctctc aaaacagaaa 9720 
ccatccaaaa catacacaca catctactta 9780 
tttctaatat atgacacaga aaagtttttt 9840 
aggtatttct caagccatgt tcccatgtgg 9900 
tctcagcaga tgattgggag atactggtaa 9960 
ggttaaatta cttcacaata tcaatgtctt 10020 
gagttggttt tgaattataa gaatgaattg 10080 
cccagcactt tgggaggcca aggcaggtgg 10140 
ctgggcaaca tggtgaaacc ccgtatctac 10200 
gtgcatgcca ttagtcccag tcacttggga 10260 
aaagtcaagg ctgcagtgag tcaggatctt 10320 
gagaccttgt ctcaaataaa aaaagaatga 10380 
actataggta ataaaattgt attggggatt 104 40 
taccacaaaa acacaaaagt gggtaactgt 10500 
atagtaacca ttatactatc tatatgtagc 10560 
gcacattaaa atttgttttt taaaaaaaga 10620 
ggacaaaatg taaagtgaat tgatcttttc 10680 
tcccttgaac aacatcttct agatcaaatt 10740 
gtttgggttg atcaacaaac gtacatattt 10800 
tgctgtcata ttctacacta tagcattgag 10860 
gctttatttt ctacacagtt gcactaatac 10920 
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cagctgcctc ttatggaagg ctggaaactg 
gccgagccaa agagaataca ttttcaaaag 
atggaagaga ccagaaagga atgatgaaag 
ctgtgggaat cactgaatct aatgaaaacg 
tagcaagttt atggactatg ataggaagca 
agacatcttg gggtttaact gaaatcaacg 
ctctagacaa tattttcaga gtatgcaaat 
caacctctgt ttttcataaa cactgtgcca 
ttgatgtaga gcccagcttt actgtgacat 
agcaacagca aagtaaaaca aaacaaaatg 
cagagccact agatcaaaaa aaaattacgr 
gtgtgctaca agtagtctgg aatggacttg 
aaaatgtaga agttctccat cttgggaaag 
agaaatttta tgtggcttaa acatccccaa 
aattgaaaat caattaaaaa gaaacacagt 
ctttgcagta aagtccttgt ttggataaag 
ataggtacaa gcttagatag gttcaggcca 
atagctagtg ttacaactag gattcaaacc 
tggagtgccc tacaaagcct cccatcttta 
aagcaacttg ttaatattag ggaaaagggc 
aaccttcctg ctgcatgtgg tggcacctgg 
gccggtgtct gctctttaat ttgtgtataa 
tccagcccct catcctggcc acaaatatta 
tccatttatt ggaacctaaa tttgaaccac 
aggaacttgt taggaaagag aataaaatag 
tttttttttc tccaacagtt ttacctgtga 
tctctttggc ctacatcatt ttcttttcta 
cttcttgccc aagctggagt gcagtggcat 
cgttcaagtg gttctcctgc ctcagcctcc 
cacgcctggc taattttttg tatttttagt 
tggtctggaa ctcctgacct caggtgatct 
tacaggcatg agccactgct cctggccggc 
cttttctttt cttttctttt cttttctttt 
ttctcttctc ttctcttctc ttctcttctc 
ttagaagctt gctttgttgc ccaggctgga 
cctccacctc ccaggttcaa atgattctcc 
aagtgtgcgc caccactcct ggctaatttt 
tgttggccag gctagtcttg aactcctggt 
aggtgctggg attacaggcg tgagccactg 
gctttaaact gtccgttcag gagatcccac 
gagcttatga tttagctggt tctgtcatta 
tatatggtga gaacagggag aagtgctgat 
ggactccgcc cttcccactc cactgaaggt 
taggtgaaat caggtactaa aatggacttg 
atacaactaa caaattcatg ttaacttgaa 
aaaaaaaaca acaaacaaac aggaaacttg 
taccttagag tttttattta tgcttttgtc 
gaagttaata gagagtaaag tcgtctttat 
ttgagaaaaa tttttaacat cattattgat 
atatatatat atatatatat atagataatt 
ctgtcgccca ggccggagtg. tggtggcgat 
ttcaagcgat tctcttgcct cagcctcccg 
gcctggctaa tttttgtagt tttagtagag 
ctcaaactcc tgaccttgtg atccgcccac 
cgtgagccac tgcgcccggc tgaggtaaaa 
atatttatac tagttgtaca gccatcacca 
ggtgggagaa attttactct gctttttaga 
tcagacaatc aggcagattg tctgtgatta 
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acaccaaact ccttattcag ccaaagacac 10980 
ctgatgctga atataaaaaa cttcatagtt 11040 
aacttcaaac caagcaactt cagtcaaana 11100 
agtcagagat tccagttgac tcatcatcag 11160 
ttttttcctt tcaatctgag aagaaacaag 11220 
cattcaaaaa tatgcagtca aaggttgttc 1128C 
ctcaacctcc tagtatatat aacgcgtcag 1134C 
ttcatgtatt tccatgggac caggaatatt 11400 
atggaaagct agttaagcta ctttctccaa 1146C 
tgttatcacc tgaaaaagag aagcagatgt 11520 
cagatcataa tgaagaagat gagaaggcct 11580 
aacaattgaa caatgccatc aaatatacca 11640 
tctgggttag tataaatttt ataacttggg 11700 
attatgaatt agaatagtat ttcatatata 11760 
gcctaaaggc acttggggga cacatttacg 11820 
attgtatgtt ttctggccaa gtaagcttga 11880 
gagaggtcaa aattacttgc ctgagattcc 11940 
caggcagatt gacttggggg ttcatcagga 12000 
atgcttgcag atttgttccc cagttaccga 12060 
cagtgtaggg agagatccat ggcatgaggt 12120 
attggaatgc atccaggagc tgcttaccct 12180 
cggagaggaa gtagacaggg caactagtgc 12240 
atgctacctt tatatgacat aagtcactag 12300 
tgtaaagtaa gacttcatag tgataaagag 12360 
aaagagaagg ttgtctcctt ttgtagattt 12420 
cctttataca aataactgac aaagcattaa 12480 
tttttttttt ccacaagatg gagtttcact 12540 
gatctggctc actgcaacct ccgcctccca 12600 
tgagtagctg ggactacagg catgcaccac 12660 
agaaactggg tttcaccatg ttagccagcc 12720 
gcctgcctcg gcctcccaaa gtgctgggat 12780 
ctacatcatt ttctaaagct ccagaccatt 12840 
cttttctttt cttttctttt cttttttctc 12900 
ttctcttctc ttttcttttc tttttttgag 12960 
gtgcagtggc accacctcca ctcactacaa 13020 
tgcctcagcc ttcagagtag ctgggactac 13080 
tgtattttta gtagggacga ggtttcacca 13140 
ctcaagtgat ccgcctgcct cagtctccca 13200 
tgcctggcct cagatcatta ttttctgtta 13260 
tgcatcctca aattcaaaat atctaacact 13320 
gatgggaata tccttttatt tccttgaaat 13380 
ggtaaagtcc tgtgattaag atagcaataa. 13440 
tgaagagcca tggacaatga gaagtcacag 13500 
gcttgagaga tcaaaattga tcacttggtg 13560 
cctttattac cctgtgaagc atggtgatta 13620 
attgttaaat tctctttaag tcagaatatg 13680 
taccattaat atgtctgcac ctgctcttta 13740 
gtctttcagt gcttacttat atttgggaag 13800 
atatatatat atatatatat atatatatat 13860 
tttttttttt tcttgagacg gagtctcact 13920 
ctccactcaa tgcaagctct gcctcccagg 13980 
agtagctagg atacaggctc ccaccaccac 14040 
acgaggtttc accatattgg ccacgctggt 14100 
ctcggcctcc caaagtgctg ggattacagg 14160 
tttaaagtgt acaattcagt catttttagt .14220 
caatctaagt ttagaacatt ttcattaggg 14280 
ttaagtttct gtctggatct aatcatttaa 14 340 
gttttggcca ttccagcttc ttcattggtt 14400 
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gttaactttc acaaataaag gctgctcaaa gattagaaat aacatttaat ttgaatgtaa 14460 
atgtgccata gtttaaaaga tgggtttggt gaatacagtc aaatacacac attraaagcc 14520 
ctaattctga agattatgta aagaaaagga aagaaatgta gggagaggat ugaaatgttr 14580 
atggtataac aatatctgaa catccatctg gtcacaccgt tggtat'tga atgttttgtc 14640 
ctcctcaaat tcatatgtcg aaatcccaac tcccaaggtg atcgtactag gaggtgtgg- 14700 
ctttgggaag tgattaggtc atgaaggtga agccttcatg aatgggattc gtgctcttai 14760 
aaaagagaac tgtgagaaat aagtttctgt cgtttgttag ccacccagtt taggatattc 14820 
tgatatagca gcctgcatgg actgagacaa ctatgagtta ttatgatagc ttctgttatt 14880 
tcacctaaat tcatagaagc caatatatca atatttatgc tatgaaatac ttcttaacca 14940 
agctttgaat atarttatat ttttgtttat ttttaaattt cagattccag atgacctgag 15000 
gaagagacta aatatagaaa tgcatgccgt agtcaggata actccagtgg aagtcacccc 15060 
taaaattcca agatctctaa agttacaacc tagagagaat ttagtgagtt caaatatata 15120 
tgttacatca aaattctttt acacgttttg taagatttct agttgcttta gctaagtaat 15180 
aagaatgttg tattcctttt tgatacaaat ctttttttat" tgtgttaaac tatatataac 15240 
ataaaatatg ccatgttcgc catttttaag tgtataattc aaaggcasta atuacatrca 15300 
taatattgta caaccatcac cactatctat atccagaact tttccatcac cccaaagaga 15360 
aacttggtac ccattaaaca ataattcccc gtccactcct ttccccagtc cctggtaatc 15420 
tctaatgtat attgtgtctc tatgaattta cttatrctag atatttcata tacaagtaga 15480 
agtatgcatt tgtcttatgt atctgactta tttcatttaa cataatgttt tcaaggctca 15540 
tctgtgttgt atgtatcaga atgttattcc ttttcatggc tgaatactat tccattgact 15600 
gcatatacca catttgttta tccattcatc tgttgatgga cacttgggtt gtttccacat 15660 
ttttggctgc tgtgaataat gctacagtga acattggtgt acaagtatct gtttgagttc 15720 
ctcttttcag ctcctttggg atatacctag gaattatgtt taactttttg agaagctgag 15780 
aaatctttaa taaatgataa cacaaatact tatatttgcc aatgcaaata tgaatattrt 15840 
tggcttttaa gagattgatc attttgccac gtggttgtaa ttaaaaaaaa ttgtcccatc 15900 
ttgtttcagt attaatattg tagcctaaaa gagtgctaga ctgttttact ttttactcag 15960 
ttaattcttt ggatactggt agagtcagga aatgagatat tgaacttaaa gatctttgca 16020 
ggtggggtcc agtggctcac acctgtaatc ctagcacttt gggaagctga ggtgggagga 16080 
ttgcttgagg ccaagagttt gagaatagcc tgggcaacat agcaagaccc catctctaca 16140 
aaaaaattaa aaaaaaaatt aagccaggcg tggtagctca cgcctgttat cccaacactt 16200 
cgggaggctg agatgggtgg atcacttgag gtcaggagtt ggagaccagc ctggccaaca 16260 
tggtgaaacc ccatctctac taaaaatacc aaaattatcg gggcgtggtg ctaatcctgt 16320 
aatctcagct actcaggagg ctgaggcagg agaaccactt gaactgagga ggtggaagtt 16380 
gcagtgagcc tagatctcac cactgcactc cagcctgggt aacagagcga gactctattt 16440 
caaaaaaagt aaaaataaaa attagacaca tgtggtggca catgcctgta gtcctagcta 16500 
ctcaggaggc tgactgaagt gggaggatct cttgagccca ggagttccac actgcagtga 16560 
gctatgattg tgccactgca ctccagccta ggcaatatct caaaaaaaat ttttttaaat 16620 
agattattag gccagacgtg gtggctcatg ccagtaatcc cagcactttg gaaggccaag 16680 
gcaggcggat cacctgaggc caggagtttg agaccagcct ggccaacatg gtgaaacccc 16740 
atgtctacca aaaatacaaa aattagctgc aatgtctata atcccagcta cttgggagcc 16800 
tgaggcaagc gaatcgcttg aacccgggag gcagaggttg cagtgagtgg agactgcgcc 16860 
actgcactcc agcctgggcg atacagcgag attctgtctc aaagaaaaag gaatttgttt 16920 
tcctgtcttt atcgtagagg gaggaaaggg agaatggggt tggaatggtt attgagtgag 16980 
ccacattatg gtagatgtat cactgggcat agagaaaagg agcatttaaa acttttccgc 17040 
ctaacagatg tttcttcagg ctacactgca ctcattgtgc taactgtaat gtcaaatccc 17100 
agacctgtgc ctatagaaca tgaacatcct tcattggatt tgtttggtca ggcttacact 17160 
ttattaggaa gatcagatgt taaaataagg gtgttaaagt taagttcaga tatgaggata 17220 
attcattact attccttttt ctggcagcct aaagacataa gtgaagaaga cataaaaact 17280 
gtattttatt catggctaca gcagtctact accaccatgc ttcctttggt aatatcagag 1734 0 
gaagaattta ttaagctgga aactaaagat ggtgagtaca tttgttattt tgactttttc 174 00 
ttctatttaa atagttgtac atttttaatt gttcttgcaa cctgtcatac ctgtgaacag 174 60 
tatgtgaata gtgaaatata attatgataa ttaaacagta gtttttatgt attgaaaaat 17520 
atctttggcc gggtgcagtg gctcatgcct gtaatcccag cactttggga ggccgaggca 17580 
ggcggatcac ttgaggccag gagttcgaga gcagcctgcc aacatggcgc aaccctatct 17 640 
atacaaaaaa atacaaaaat tagcctgaca tagtggtgta tgcctgtagt cccagctact 17700 
tgggaggctg aggcagaagg atcacttgag cccaggaggt ctgtgttcct gccactgcac 177 60 
tccagcctgg gcagcagagt gagaccctgt tggggggaaa aaaaaaaaag tctttaactt 17820 
aaataaattt gacatttaaa atcttaaatt atttcatctc tgtttcagta ctaactctgc 17880 
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atttattact ttctttttaa taggactgaa 
ggaaaaagaa aaagataaaa atatttttct 
aatacaagta atagcatgtt attgaatat* 
ataataaagt atgaagrtcc ttgtaacacc 
aagagtaagg aataacttga tttaaaatat 
acaaattatt gacttaaccc aaatttaaaa 
aatagagttg atcatgttaa ctggtaaatg 
aacaaatgaa aacgtagttt taagggtttg 
tttactgcac aacccatctt attttgacag 
atcagatcac ttttctttgc ttccataact 
tttaaaagac ggtgtctcac tttgtcgccc 
cactgcagcc tcgacctccc aggctcaggt 
gggaccacag gcgaatgcca tgatgcctgg 
tttcaccatg ttgcccagaa ttgtcttgaa 
cccacccaaa gttgtgggat tacaagtgtg 
tttaagagtc atcttttttt tttttttgag 
gtgcagtggc acactctcgg ctcactgcaa 
tgcctcagct tccctagtag ctaggattac 
tgtagtttta gtagagacga gatttcacca 
ctcaagtgat ctgccctcct cagcctccca 
cacccagcca agagtggtct ttttacaata 
cataaaattg aagatactct agtcatttag 
tctttatttt tgaaatgtta ttgaaggaat 
tgtgaaaagg ataattgtga cacaaatcaa 
tattaaggca ataacattct ttctgcttgt 
gtacattgtt attgtcaagg gtgtttaaat 
tggtataaca gaatcagcaa tttagttttc 
actttgaaat gtaaaactga tttttccttg 
aaagaagaaa acagtgagga aattgacttt 
gggtaagaag ttatggccaa actagcatgt 
agttttcaat gtaaatatta aagtagatgt 
cagtagatat tttttcaagg attgtctcta 
cgtctttttt tttttctctt tatttttatg 
ccttgtcttc ttcgataaca agaagtctga 
atcgatgaga agaaagcaac tagatatcac 
attcttagaa caaataaata cattttaaaa 
aaaaatattt caaattaagt tattccttca 
atttgtgttt ttctcaactt ttaaaacaaa 
gggctagata aaatataaaa aatatttttt 
taatatgaga atctcttata aacactacct 
tgtagtagta gggatttgat ttcttagaat 
attaaacgat aaagtcaaaa tgtttatagc 
tttttttttt tttgagatgg actctcactt 
tctcagctca ttgcaacctc cgcctcctgg 
aagtagctgg gattacaagc atgcaccacc 
gagatggggt ttcaccatgt tggccaggct 
ccaaagtgct gggattacag gcgtgaacca 
gactctcatg tgatcatgta aagtggcagg 
atgtttgtaa aatataatct acagattgat 
aataagtttt tagttatcct cagtacttca 
taaactaaat catttggggg ctagaggtgt 
tctattaggg caaaactttt agtaactgca 
agcttggagg ctgggcgcgg tggctcacac 
cgggtggatc acttgaggtc aggagtttga 
tctctactaa aaatacagaa attagccagg 
ctcgggaggc taaggcagga gaattgctcg 
agatcatgcc actgcactcc agcctgggtg 
aaaaaaaaaa gcttgaagtc agattcgaca 
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ggaattttct ctgagtatag ttcattctcg 17940 
gttgagtccc aatttgctgc agaagactac 18000 
taacaaaata ccatttgtta catatgatcg 18060 
ttgcattgtg aagtgtatta aaaacctcc: 18120 
tttattctgt aatctctcta aattatccgt 18180 
atgaatgcct tagcacaatt aagttccaag 18240 
gatcatgatt taaaatcctt ctaggattga 18300 
attttttaaa ttcctatttt tacatgcaat 18360 
ttcttaaatt cgcaactcct cagaaatatt 13420 
ttttttatta ttatattatt attttttctt 18480 
aggctggagt gcagtggcat gatcatggct 13540 
gattctccca cctcagcctc ccaagtagct 18600 
ctaatttttg tatgttttgt agagataggg 18660 
ctcctgggtt caagcagttg ttctgccttg 18720 
agccactgcg cccagctatt ctagaagtat 18780 
atggagtctc actctgtcac ccaggctgga 18840 
cctccacctc ctgggttcaa gtgattctcc 18900 
aggcgcatgc caccatgccc tgctattttt 18960 
tgttggccag gctgctcttg aactcctgac 19020 
aagtgctggg attctaagtg taaaccacca 19080 
ttattttttg attaggacat tcattcttgt 19140 
aatttcattg ttttggaact agacattgtt 19200 
accatttgga gaagatacaa atgtaagaat 19260 
aattatagat aaaaatatac ctgtaaaatg 19320 
tgaccataaa tatttatatt ccctggatgg 19380 
aatgatcttg catgcataat ttattctctc 19440 
cgggacccga gaaaaacatg caaaagacat 19500 
caactgtagg tccttctaga tcctatggta 19560 
attcttcctt ttttaaagct gagctctttg 19620 
tagacatgtt tttaacacta tatctggcag 19680 
taatgtcaat aagtgatctt aataatgcat 19740 
tcttcacgcc tagcttataa tttgccttgt 19800 
tttttatcca tccctggtgg taggggataa 19860 
agcttattag aaattttact ttgagaattg 19920 
gtggatcata tatgcttgaa taaaacaata 19980 
gttaaagcca aaaacattag ttgaatgttt 20040 
ctgtcttgta ttactgtaat aatttggatt 20100 
tatttaaaaa attcctcttt tgattaagta 20160 
aaactcctct taatttccat atttcttata 20220 
cttagaagtc tccacagaag ctttggtaga 20280 
ggtataatct gtaaatgttt tagtaaaagg 20340 
acagtgttta ttaatataaa ataaaatctc 20400 
tgtcactcag gctggagtgc agtgttgcaa 204 60 
gttcaagcaa tccttccgca tcagcctcct 20520 
acacctgcct aattttttgt atttttagta 20580 
ggtctcaagt gatccgcctg cctcagcctc 20640 
ctgtgcccag cataaagtaa aatctcttca 20700 
cagtcacagt caagaagtag tttaaagttc 20760 
actggatttc ataggtaatg tttaagagaa 20820 
aaagcaccca tttatgatta tgttgattac 20880 
ttttttatgt gttaagattc cttaaggagt 20940 
tattttaaaa gtaataaaac taattttaaa 21000 
ctgtaattcc agcactttgg gaggccaagg 21060 
gacgagcctg agcaacatgg tgaaaccttg 21120 
tgtggtggtg ggcacctgta atcccagcta 21180 
aacttgggag gcagaggttg cagtgagccg 21240 
acagagcaag actccgtctc aaaaaaaaaa 21300 
ttaatcagta tactttctct caagtagggg 21360 
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acaatttcta 
gtctataatc 
gagactagcc 
cccaatcagc 
aggaggatca 
ctccagcctg 
taaattaatt 
cctgcttcag 
ggcgtatcct 
ctgatgtctc 
agtggttaag 
gggttttgac 
gacatatgga 
ggggagtgat 
aattatatgg 
tgttgaacca 
ctacattgct 
agtgattagt 
aaatctggcc 
agaggttgta 
tgtgactgaa 
aactttagcc 
agttgactgt 
cattagaaag 
tagtctttaa 
tttgataaaa 
aactttttgt 
ttagaatata 
ggttgcttca 
accatataac 
aaaaaatatt 
catatagttc 
gtaactcacc 
ctaggcagat 
ttttcccaca 
aaactgggta 
ttcttttttt 
tgcgatctcg 
ctcccgagta 
tagtagagat 
gatctgcctg 
cctccttttc 
ttgaaccatg 
ttttatagtt 
cccagcactg 
aaaacataca 
ttgtcctgct 
acagtcctga 
ttaaggtctt 
cagagaataa 
agttgtccta 
aacttcatgg 
atttactctt 
caaattctag 
ggctactgtg 
atgaagatat 
ccagggtgac 
gtaggagcat 



agattttagt 
ccagcacttt 
tgggcaacat 
tgggtgtggt 
cctttgccag 
gatgacacag 
aactacactg 
tcttttatca 
ccttggagca 
ttgttgcagg 
gtgtgttcat 
catctattat 
aagcattcat 
gacgaataag 
tttttctttt 
gccttgcata 
gagttttatc 
ttgcagtttt 
tcataaaatg 
taaaattgag 
tatattggga 
aaagcaatct 
aaagctttac 
acaggaatgt 
cttttctgtt 
tttctaaaac 
agactacatt 
ctctaattgg 
ggggagagaa 
acttttgtac 
gggaagattt 
caactaatca 
aggaagtttg 
gcatttgcat 
tcctactttt 
taaatgaata 
ttttttttga 
gctcactata 
attgggacta 
ggggtttcac 
ccttggtttc 
tgagttttat 
ttgatgaaca 
aaatcaatat 
aaatgatact 
aaaaacccta 
ggatgacctt 
tgcggtgcag 
gttcttttgt 
tatatgtgtt 
tagactgtaa 
ttagtccttt 
ttgttcattt 
gagaaaaaga 
tatgagtagc 
tccctgggct 
caacaaggag 
ataacctaaa 



cttttaaaac 
gtggggccga 
ggcaaaaccc 
gttacactcc 
ggcgtttgag 
caagcccctt 
ggaaggcaaa 
tgtaactatg 
catcactcac 
acttaggaat 
ttttctgtaa 
atagggtggg 
ttattcacta 
actgatgttc 
ttaggctatt 
cctgtgataa 
tgctaatgtt 
ctgtttttgt 
agatgggaag 
gctgaatctt 
at tcctataa 
gtaaagaagc 
gaggtatgag 
tatacataat 
tatcatttag 
tctccatatt 
tctggaagtg 
tataaatgat 
agtaggaggc 
ttttaaagtc 
tactttgaac 
tgaacttgtg 
aagccaaatt 
ttgattttaa 
tttattttgt 
catgcataca 
gacagagtct 
gcctccacct 
caggtgcatg 
catgttggcc 
ccaaagtgct 
aaaatttgat 
agtttttgtg 
cgagcttttc 
gaaaccattt 
gaggtggctt 
gacctcattg 
agccagcggc 
cagtcagcat 
atgttaagtg 
tagcaaaatt 
agggtttttc 
gacaaatatt 
agggtgaaca 
cagccctttc 
ttacaggtca 
atgacagcat 
ctgggggtga 



ttattaacta 
ggcagatgca 
cgtctctaca 
tgaagtccca 
gctgcaggga 
tctcaaaaaa 
attcagcatt 
catattttrt 
agcctcctgg 
ggagctctrt 
catttaataa 
ttttgaccat 
atatttctgt 
cccatgccct 
aggtgttgat 
ataccacgta 
ctgttgagct 
gttgtctttg 
cattctctcc 
ggtggttgcc 
agcaattatt 
atttgacaaa 
tatggtaaca 
gctgtcaatc 
tcattaaaat 
taatggaggc 
ctcactgaca 
ctctgaattg 
tgtggacagc 
cttaacattt 
agttaatttt 
tatttcctgt 
tgtgtttcaa 
atgaatcttg 
tgtaagccat 
ggaattatag 
tgctctgtag 
cccaggttca 
ccaccacacc 
aggctgatct 
gggattacta 
actttactgc 
atgggtatat 
tagtgctttc 
catatcttct 
tctcagaggc 
ctggactgcc 
ttgctcatgg 
ttttagtctt 
ttgtgtttga 
ggtagagtaa 
attctccctt 
tgtcaaatgc 
gtattagcgc 
ttggctttct 
ataaatggaa 
acactatgcg 
ggtgggataa 



gtctgagcat 
tcacttgagc 
acaaangcac 
gctactcggg 
gctgggttca 
aaaaagataa 
tttttatagc 
acagaggagt 
gacgcccttt 
tactcacagg 
cttttcattt 
ctattatata 
gtgtctgctt 
ttttctgtgt 
agggttgagt 
gttgtggtgt 
tttgtccatt 
tctggtttrg 
tcttcttttg 
acaatgacag 
ttctagggaa 
ctggatgccc 
ctctatataa 
taataaatac 
ttctttggct 
ctattttttt 
ccactctgaa 
ctatggaaaa 
aatgaggaga 
acattattat 
tcccccatgg 
tctttgtaaa 
atatagcaac 
atcccttact 
ctaaaattct 
tagcatattc 
cccaggctgg 
agcaattctc 
tggctaattt 
caaactcctg 
gcataagcca 
acgctttgag 
taataaaata 
aaaaggacaa 
gtattaagga 
agtgtggatg 
tgctgtcccg 
taaatgcatc 
aacaataaat 
ggcccctgat 
aaacagtgtg 
acttattgtt 
ttgtgcacag 
agaacgatac 
tggattgctt 
attcagagag 
agaagtatac 
ggagttatca 



ggtggcttgt 
ccaggagccc 
acacaaaaa= 
aggccgagcc 
caccactgcg 
aaaattaaa^ 
taaatttcat 
gaattcctta 
gtctcggcac 
aggaaaggta 
atctttctt- 
gggtttatac 
ttaggtgrtg 
cagttgatac 
aacttacaaa 
atcattcttr 
taagtttgaa 
ctatccgtgr 
tttttttgga 
gaactatttc 
gtggaaaatc 
atgiggagag 
atcccttttt 
acatatcatc 
ttctaatgtt 
ttctagccag 
aaattagtac 
ctgggagaat 
attacagttc 
ctattcaatt 
gtaccgctgt 
tttaaacttt 
tccaggatct 
ctcacttatg 
caatgggatg 

CttttCtttu 

agtgcagtgg 
gtgcctcaac 
ttgtattttt 
acctcaaagt 
ctgcacctgg 
actgtattaa 
tagatcaaat 
cctgaatttt 
aaaaggcttg 
cagccatctg 
gaacatgagc 
caccactggc 
ctactctctr 
ggcattctac 
aaaattctgc 
taatttacag 
tctgtattct 
taataatgat 
tgtattctac 
attaatttga 
acagagtagt 
gggaaggctt 



21420 
21480 
21540 
21600 
21660 
21720 
21780 
21840 
21900 
21960 
22020 
22080 
22140 
22200 
22260 
22320 
22380 
22440 
22500 
22560 
22620 
22680 
22740 
22800 
22860 
22920 
22980 
23040 
23100 
23160 
23220 
23280 
23340 
23400 
23460 
23520 
23580 
23640 
23700 
23760 
23820 
23880 
23940 
24000 
24060 
24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
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tttggaggag 
atttcatgct 
ggaagtaatg 
gtgctaggga 
gctgaaatag 
atctcaaatt 
ctgttactgt 
taggtcagga 
tatgaaacct 
actgtatttt 
tttcagagac 
ctcactagac 
agatttatta 
gacatgaaag 
tttttaatga 
attgcttaat 
ttgcactgat 
aaggagttca 
acttgtaagg 
aattcgtggc 
tggtgcatat 
cgctttccaa 
agaaatagat 
ataatggcac 
aaatatgttc 
accctaaata 
tattattaag 
gagaaataag 
atgcttctta 
attaagatat 
catatgtaga 
agaagtctcc 
aatttgcttt 
atatacagtt 
tgtgaaattc 
gatcttgacc 
gtacttgtgg 
agtatgtttt 
ttgtagtaag 
gtagaaaatt 
ataactagta 
ttccaaaagg 
cctagagacc 
gatactatcc 
cagaagaacc 
gagtcaacaa 
aacaaatttt 
aggctggagt 
tgcctcagcc 
ttaattttct 
tgatgcagtc 
atacattttg 
aactgtctgc 
tcaaggttca 
aaaagcagac 
ttgttcttca 
gagaggcaaa 
gggttaagga 



ttgacaactg 
aataaagaag 
atatgttggg 
ggtgaggttg 
atataaaatg 
ttgaaatcta 
tcttatacta 
caggactcag 
tataagacct 
gtttaacaaa 
aaacttttat 
attgctctga 
ggtcctcaat 
agcgatacca 
atgtataatt 
tccagctttg 
tgccacaagt 
catatttcag 
attattgaat 
tttaaattta 
tgtgctagag 
gaaaatgact 
agatggcttt 
ttagtcccct 
caggactggc 
ttcagaccct 
gataatagaa 
ttttatagga 
ttggagaaag 
aatttaagta 
tgccatgaaa 
tagccctttt 
ctgtcactat 
gaatacaatt 
tgtgtaatgt 
tgcagcatgt 
atcgagccat 
actattaaaa 
acaagaatta 
agtgtttcca 
aaagaagttt 
ctctccgcgg 
tgggttggga 
agttacctgc 
actgtattat 
gtgtttactg 
aattttatta 
acactcacag 
tccccagtag 
tagagacgga 
tttgatgata 
atgtataatt 
tgggatttga 
caggactgat 
ttggcaggca 
gaagatcaga 
gatcattgca 
gcctgctgca 



agccgagttc 
caaaggaagc 
gaa^accctg 
gagggtttgg 
caactaagag 
tagcatctat 
gatctattag 
atgtacatta 
ggggtaggaa 
caatacagta 
cattcgttca 
gtatatggtc 
agataaatca 
tacatactgc 
tttaaatttc 
aatgatatga 
cagtctcagc 
tgcgtccaac 
tatgtccctt 
tgcttctctt 
gcataaatta 
tttttgaaaa 
taaacacttc 
ttgggaactc 
aaacatattc 
gtgctagtta 
tggtatttga 
accaaaaaaa 
aaatgacaat 
caacaaactc 
ccatcaccac 
actacccatt 
agatttgtca 
ggaaattcga 
aataaaaaat 
agctaaagaa 
acattctcga 
cctgaacttg 
aatatattcc 
gctaagatga 
tgtttatttt 
atttcttcct 
caagattggt 
caaggtatgt 
tggctttggc 
agttaccaaa 
attaattttt 
ctcactgcaa 
ctagaactac 
gtcttgctat 
agaaacttat 
ctgtttgctt 
gcagaaatgg 
gggtgaagct 
tagacgaggc 
tggtagagtc 
tgagatcagg 
tggcaactcc 



tgatggaaga 
gnggtctaca 
ctgactggag 
cagcattgac 
tggcttggat 
aggactggtg 
tccagtgttt 
ttaatgccta 
gagattgttc 
tggaaattta 
tttatttcat 
tgagtttgca 
gggaataact 
accttaaagg 
atgtttactt 
taaaagagtt 
aatctctaca 
acattcagcc 
ttatagaaat 
aatgatttta 
taatttatag 
tggtatttct 
attaartaaa 
atgagggttt 
taaattcttt 
actgctattg 
gatattggtc 
aattcttaaa 
catttattaa 
acataaagtg 
aattaaggaa 
cctcccctgc 
acctgatttt 
attttgtgtt 
aaattggact 
actggcgggt 
ctctctcgtc 
gaatcttctt 
attgtagtat 
tggcatattt 
taaacagaat 
gcgtctttgc 
gggttacatg 
ttaaaaaaag 
tttatgtgtc 
taaatgtctt 
tattagaatt 
cctcaaactc 
aggcatgaac 
gttgcccagg 
aatggaaagc 
taatcattca 
ataggaataa 
agatttccag 
agatagcagg 
taggaggtag 
gacccatgca 
tgggaacagt 



gtagaaatta 
ggcaaaagca 
cttagagtgc 
ttgc* ccaag 
tattattacc 
ttaccaatcc 
aagggagtgg 
tttcagttct 
tggaagtcat 
tcacccttcc 
aagatccacg 
gtacctcttg 
agatggattc 
tcaaccttag 
ttcctaagct 
ratctccatg 
tcctttacrc 
tcctaatcag 
tatttttcaa 
aggatatgta 
ccacctgaaa 
ttgaatgaga 
cttttttttt 
tagtggtagt 
aaaattttca 
aagaacaaag 
attgaatatg 
ggaaccatat 
tgtgattttt 
tacaatttga 
acaaacattt 
tccatcccca 
ctccaaatat 
tttttcttta 
gtgatataaa 
ttgtggctag 
agagtatatc 
tctattgtgg 
ttgaataagc 
tgaaaattca 
tagttttaac 
gaagtgtcaa 
aagttaggca 
aaaaagtgaa 
agcttgccca 
aacactattt 
gagacctcac 
ctgggctcaa 
caccatgccc 
cagacagaut 
tgaggtgata 
aattgtagta 
actaggaggt 
acccgggatg 
ataaaggaga 
tgtgttttaa 
aaggagtgag 
ggccactggg 



gcatgaacca 
cagagctace 
aaggacac^s 
gctcttiaaga 
tagtgtgtta 
tacactcgac 
tgcagattrc 
gacct*ctca 
aggaacatga 
agaatattta 
agtagggaac 
tgtctccaur 
attttutaaa 
agtatcatra 
tttgcactaz 
ggaagtttgc 
gttcctgccc 
gtaatacac" 
ttttattagt 
agtcaacat" 
tgttagtatg 
aagaacagag 
ccaccatcac 
gagctgaaag 
cctagcatct 
gtattatatc 
aatatgtttt 
attactaaaa 
tcacaacttt 
tcagttttaa 
tcatcactcc 
gacaactacc 
acattcaaaa 
ggaacaaaga 
caagttcacc 
agattttaca 
caccagagaa 
agaaatgtaa 
agttattcga 
tatagtgaat 
aacattggac 
cctgcataaa 
gatactcatg 
tacttactcc 
atctccgtgt 
taggtacttt 
tctgtcatct 
gcaatcctcc 
ggccaactcr 
ttaatgtgta 
gttacagtaa 
aagcaagatg 
agaagagtta 
tcagtccttg 
caaatgtaga 
tcagagatct 
aaaaaaaact 
gcctgggaca 



24 900 
2496C 
25020 
2508C 
2514C 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
2562C 
25680 
25740 
25800 
25360 
25920 
25980 
26040 
26100 
26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
26880 
26940 
27000 
27060 
27120 
27180 
27240 
27300 
27360 
27420 
27480 
27540 
27600 
27660 
27720 
27780 
27840 
27900 
27960 
28020 
28080 
28140 
28200 
28260 
28320 
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tgttgattgc 
agctagcagg 
tcagtacatc 
ttcagattgg 
gcatacctaa 
ttcaaaaagt 
gattatttgt 
aaatgtacac 
gttaaaagat 
agttctgatg 
cgtagttcct 
ttgctgttac 
tctttagctg 
tttgtttctc 
ctgttgtatg 
agtagaatga 
ggtaaaatta 
cattcacaat 
ctcctcttgc 
ttctgtatat 
tcacttatgt 
tttgcatgac 
gaattgtttc 
ttctccacgg 
cttagggtaa 
cattcccact 
tttctcaatt 
taaaagttgt 
tgcttaaggc 
gcaaaccatt 
ctggggtttt 
agactaggtc 
cagatcattt 
cagtatctta 
attccaagac 
gtttagtaat 
ctctattggc 
tgggttcaag 
tgtattttta 
ctcgagtgat 
tgcccagctc 
tcgtgttttt 
ttcctgttat 
ttgtgttacc 
gggttcaagt 
gcacccggtg 
gcctcgacct 
ggcgagaacc 
tagttctctg 
gtggttgaat 
tggagatagt 
cccaatttaa 
cgaaaggttt 
cttttcccac 
agtaattgaa 
tgggactttg 
cttatgtggc 
tggagtttac 



agcccaggac 
atcatgaccc 
cagatgcagt 
agcagaggta 
taaaggagac 
tctcttgttc 
tcagcctgga 
agctctcata 
tggtttgtac 
cagttatatg 
ttgagttcat 
taaagaaaga 
ctacttagtc 
agtatccaga 
gtccgcctgg 
attttataag 
acataaatgc 
gctatgcaac 
ttatcccctg 
ttcatataaa 
aatgttttca 
tgaataatgt 
taccttttga 
atatgttttc 
ttctctaact 
agcagtgtgg 
gtgggctagt 
atgaaattga 
aatcttcatg 
cttaaaggga 
tatggttctg 
taagtttttt 
tgggtaatgc 
gctgtgtaat 
aaaggaatcg 
ttatttattt 
caggctggag 
ctattctcct 
gtagagatgg 
ctgcccgcct 
agtttagtaa 
ttgagaactg 
tttgccttag 
aggctagagt 
gattcctgcc 
aatttttgta 
cctgacctca 
accgtgcccg 
actgtattga 
attagaaatt 
gatttttcac 
ggaaagacta 
ttcagttggc 
atgttctaaa 
gatgctgatt 
tcccttctta 
agacactgtt 
attctactag 



tgttaaaacc 
cgatgctggg 
acacggagac 
gaggtgagtg 
caggatattg 
ttgagcagtg 
gactcttggg 
acttgcccca 
tttttaaatg 
cattttatat 
ttacagtttt 
tggtcgtgat 
atttctgttt 
attatttgca 
aacaggaaaa 
tgtcaaggta 
agttagccat 
caccacctct 
gcaaccattc 
acaaatcatg 
tggttcatcc 
taccatactt 
ctattatgaa 
atttctcttg 
tttcaaagaa 
ggggttcctg 
ctcacatttg 
gtaatgagcc 
cattgtgaac 
gtagacaact 
ttacttttga 
tcaggtataa 
ttcacagtcc 
ttcagacatc 
tgtattattc 
gtttctgtat 
tgtagtgatg 
gcctcagcct 
ggtttcacca 
tggcctccca 
tgtataactg 
gcaatgacgg 
tttttttttt 
ggagtggcat 
tcagcctccc 
tttttagtag 
tgatccacca 
gtcttgcctt 
ggaaatgtaa 
ccttattttg 
tagagatgac 
ttctcattat 
ttttagggaa 
aatgatatat 
aaagtcatat 
caccattcac 
tctggcacaa 
tggaaagcga 



agtgtgagag 
atggggcatc 
tatatgcg^a 
ggaatattct 
cagacagtag 
gcgccttaaa 
atattttact 
tgaagcatat 
tagtactttt 
agaatgtgtt 
tagtaggaat 
taccatctga 
agacttgagc 
aacttgccca 
accttactag 
tgttgtctac 
ttcaaagtgt 
ctctaatttc 
atctgctttt 
caatatgtga 
aggtagtagc 
tgtttatcca 
taatgttgct 
ggtataaact 
ccaccaaact 
attctccaca 
gaaagctagt 
acctctctct 
agaattatac 
agaggcagga 
ctatatctca 
ggtgagtgtg 
accactggtg 
agcaatatta 
tagccttatt 
ttatttttat 
caatcttggc 
cccgagtagc 
tgttggccag 
aagttctggg 
ggttttaccc 
agaaactaaa 
tttttttttt 
gatctcggct 
gagtagctgg 
agacgggatt 
gcttcggcct 
agttatttct 
ttaaatatta 
gtcacatatc 
tttaggacct 
tgattttgct 
gattatatat 
tctttaactc 
ctctacacat 
ttattcactt 
gggattcagc 
caacaagcag 



aacatgggta 
aagcattagt 
actgctgact 
caacagaggg 
cctcatgtrt 
aggtaacttg 
atctttgatt 
ccatgaaagg 
aataaaacag 
cttaattgga 
tgtattttct 
attttttttc 
tctttttcat 
tacgacaaag 
ctggggtaat 
ttatcttctt 
aaattcactg 
aaaacttttt 
tgtctctatg 
ccttttttgt 
atgtatcagc 
cttatcagtg 
gtaaatattc 
gaggagtaga 
gtctttcaca 
tctttaccaa 
gggagcagcg 
tgtagggctt 
ataaatgctc 
gaccatactg 
ccattgcttt 
gtaattaagg 
tgtcattgtg 
gtttaacaaa 
caaacttgat 
ttctttgaga 
ttactgcaac 
tgggattaca 
gctggtcttg 
attacagacg 
agttgtaaat 
agtgccaggc 
ttctctgaga 
cactgcaacc 
gattacaggc 
ttaccatgtt 
cccaaagtgc 
tgttccctcc 
ttatgttaat 
ctgatcagta 
attcaggttt 
atatgcaggg 
tctctttttt 
ctatgaaaat 
tttttaaaat 
ggaaaaacta 
agtgaacaaa 
atagacacat 



tggaagcact 
acatggaget 
ttgggc-"t 
aactaaa-ag 
ggctcacc-g 
agaagcag^c 
gaatagar ~t 
cactacactt 
gaaaaa^aga 
aaaaattcgt 
actgttg-ac 
tatacat^ga 
atttttt-tt 
aacaggaaca 
rgcacgagag 
tttttattta 
gcatttagcg 
cattccaccc 
gatttgcctt 
ctggcttr-c 
act tear" cc 
gtgaacatct 
atgcacaaat 
attcttgggt 
ccaactgcac 
caccattatg 
atccatctat 
attatgttct 
agataaaagg 
aggcaggaag 
tgtcaaagtg 
ggcatgetag 
gtegcagate 
gggcaartag 
ttataaatca 
tggagtc^ca 
ctctgccrcc 
ggctaatuut 
aactcctgac 
tgagctaccg 
tactcttttg 
tgttgccttg 
ctgagtcttg 
tctgcctcct 
gcctgccacc 
ggccaggctg 
tgggattaca 
tctagtccta 
agatatt^at 
gttggtcttc 
tttttaagat 
aaatttattt 
tttttttggc 
acattgtttc 
ttgagataga 
ttatccaata 
actgcctctt 
tcagtatata 



23380 
23440 
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attcactgtc agatggtggt ggtaagtcct 
tggagtaact ggagtgagtc atagatggac 
atttgggcag agatctaaat aaaatgaacc 
gttctgggca gaagcatcaa gcatagaact 
aattttaaaa atgtataaaa gacatccatt 
tagacttagt cagaaaccaa atttacattt 
ttttacccaa taggggccag agttactcag 
tcgggatatt tttattaggt tggtagccta 
ttatttatca atcagtgctt tttttggtct 
gtggtttatg tgaattatta ataagctaga 
acaaaacatt ttagatatta aattttggaa 
ctcctcaaag tggaatcgaa gtggttattc 
agcaaataat tgcccctaat ttatctctaa 
cagtttctaa tttatctctt ataagtcaag 
tgtaactatt ttgcatatat taaaaaactg 
tgaaaataat tattcaaatg tgatagcatt 
ttattcttcc aaaaatttta ttataaagta 
atgcagctta aggaagaata ataaaatgaa 
ggaaaaagca taaacaaaat aaacctcttc 
agtggaaaat atttgggagc aaacgataar 
ttgcaaaact gatttcaagg aaaatttata 
agaagttaac cacttatgta tctatctcat 
aaaatatgtt aaaagggaaa taataaagat 
agaagctcac aaagccaaga tttatttttt 
caagtttgat taagaaaaaa gaaagcatga 
atcgctaaag atatcccaga aatgtaaaag 
gccaatacat ttgaaaactt aggtgacata 
aaaaagaaac aaaatctgag tagtcctgta 
agaagtcttt acacaaatca aacatcagac 
tcaagtagca gataattctg gtctattttt 
catttaatga gatagctgtt gatttttttc 
gttattcgcc agacatctag tccacctgtt 
tgaattaaaa tttgttaata aattaataaa 
taaaagaaat aaaatatatt ttatagagag 
tttccaaatt ttgaatgggc aaaataaatg 
gccaataagt atatattaat ataaaaatgg 
cttattgact aagagtcagt ttttgttttg 
tcttaataaa caccttgacc tcaacagttt 
gccttcttta agggtttgtt gtaaagatta 
ttatatgtat ttatatgtaa ttacatacaa 
ttaaaagaag tatataaata tatataaata 
gaaatcactt tgccaactat gaagcctgat 
gagcacaggc tgcaaagccc tgcattcttt 
ggcggggtca tgataataca ggagttacag 
tggatggagt agaaggctta cagggtaata 
aaaatgtcat catgtcatca gattttggta 
atgtattggc tgctactagt cgccctgact 
gactagataa atgtgtatac tgtcctcctc 
ccaaaaccca acaaatgcta cactctttcc 
aattgtcctt agaagaccag ctttcttagg 
ataaaaagat tctgaattag. atgcaaagcc 
ttgtaatcct tctgtgttgg ctgattgggg 
tattttcaca ttatcttctg ttcaaagatt 
actctgatac agaatcaagc atgtgaatcg 
tttttcaact cttccttgtc ctgtgttgtt 
caaataaatg aatgaaagaa cagatagaca 
atatatgtta catgtagcta ttatttaaat 
tggcacactt gcctaaatct agaaaataag 
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atgtaggaag aaaagcaggg taaggaggct 31860 
tcgtcaggaa agggtttctg aagaggtggt 31920 
aacaagccat gagaatatcc gggggaaaat 31980 
tgtggcatga tatttattct agcacacatt 32040 
taatcatatt aaagatttcc atgattcatc 32100 
cctctttaaa taattttatc ccaactcttia 32160 
caaatacatt ggagcaagtg aacaagctgc 32220 
tgaatgtttr taaagtaact gactctgtta 32280 
tgttttttga agaactgata tttgaaacct 32340 
ggacgtggat tctctatttc atcaaataat 32400 
attatttggt tttgrtttac aatagaaata 32460 
aaagaaatct cagagtagat tcttatatga 32520 
attttgtaag ttctaaattc ttttttcccc 32580 
agtccatctg gccaatttaa tttcagtgag 32640 
tatatgaata cagaagatgg tatttaagga 32700 
atggggagtt ttaaaataaa agttactgtt 32760 
tacagttaag agaatataca taaaatacat 32820 
tacttcatgt attcaccacc gagtttacca 32880 
cacgtaattc ctgggttaaa gagaagttat 32940 
gaaaatacta tccattaaaa ttgttagatg 33000 
gtgttaaatg tttagaaaag aaaaaaggrt 33060 
gaaattagga aaattataga tataaactaa 33120 
aagaatgaag tttaatgaaa cacaaaacag 33180 
gaacaccgag tacaattgac aaatctctaa 33240 
ataaacaatt ttagggataa aaagggaaac 33300 
ataataaggg aatattatga aaatattcat 33360 
gacaaaaaca aaattgacca aaattgagca 33420 
acttagtaaa aattgagtta gaaaagttaa 33480 
tcagttttct aggagagttt tgccaaacat 33540 
ggccccagaa gatatatttt acttgccatg 33600 
aatcaccgtg acaggtgttt tatattaggt 33660 
gccagatatg gaattaatat tcacttattt 33720 
acaaagtcaa agttcaaatt attaaaaaag 33780 
cccttacaaa acagtaccaa cataatgagc 33840 
aataggcatt tcacaaaaga aggaagggtg 33900 
ttacttgtaa taggaatcaa aagtgtttga 33960 
atccctgtta gtctatccag aaggcatggg 34020 
actgaataca agggtaattt catatgcctt 34080 
aaataaatac ataaatatat ataaatacat 34140 
cttgccttct ttaagggttt gttgtaaaaa 34200 
cataaaataa atacattcat atatgtatat 34260 
tcaaatatga aatgttgttt gtttttccca. 34320 
tctttgatga atttgaatcc attgctcctc 34380 
accgagtagt taaccagttg ctgactcagt 34440 
attataaata cagaaataga atgttataac 34500 
aaaaaatgtt cttttttcct ctaggtgttt 34560 
tgattgaccc tgccctgctt aggcctggtc 34 620 
ctgatcaggt gacaatttca tatttagagt 34680 
ttgtgagctt tacttctgcc aggtaatggc 34740 
gaaaagcttt agccactgtt tgctcaaagc 34800 
tttttttggc ccagtgcaag tctgaaaact 34860 
aaaaaaaaat gcaagaaacc taatgtatta 34 920 
acatacttcc attatcctgt caaaaaaaaa 34980 
taagcatgta agcaggtttc atagagataa 35040 
ccaactctta ttctccaatt tagaagcaaa 35100 
aatgaatagt caaaggtata aagtatctgt 35160 
tatttagatt ttccttttga aataccttct 35220 
cactgtgtga ataagaaatt atttacactg 35280 
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aatattttgt aggtttttgg gtttttgttc 
ctggagtaca ctggtacgat cacaactcac 
ctccccacct cagcctcccg agtagc-ggg 
attttattat taatttttgt atagagacgg 
actccagggc tcaagtgatc ctcccacctc 
gagccaccat gcccagcctt aagagtgctt 
ttctgttggg gaaaaaattc caaggaagat 
ttacttataa agctttttag atatataagg 
aatttaagat aatattttta attttatttt 
ggtgtcacgt cttgaaattt taaatgtcct 
tgaccttcag catgtagcat cagtaactga 
actttacaat gcccaattgg aggccttaca 
aagttatatg aggaagttgt tatgacattt 
atttccacct taaaaaatgc tattttttaa 
aatttacctt tagttgaatg ttccatagtt 
tatgaagttt gatgtctgtt tctttaacat 
tttgcaagga tattatttaa attgggatac 
tagagttttt tgtttgtttg tactttaact 
ttgaagctca cattgttcca atctggccaa 
tttatgacat gtcctcatca ttcttgaatc 
tcttggccag gtgcagtggt tcacgcctgt 
aggatcattt gggcctagtt tgagaccaaa 
acaacagagt gggatcttgt ctctgtgaaa 
atacctgtag tcctagcttc ttgggagagg 
aggatgcagt gagccatgct tgtgccactg 
tgcccccaaa aaagaaaaat attcttggtt 
catcagcctt ttctctaaag acagtattat 
tgttacatta tagactttac catatatttt 
accacatttg tttggaatgt ctacagaacc 
ttttgctatt ttggcaagcc attgaagttc 
gtatttgtag agctctctat aatgagaaag 
ggagtagaaa agtatgaatg gaaagtcaga 
cttagcttca ttacagactt tcttggggga 
tgtctttata attttaatag ttaaattttt 
atgagctctt tgaaaaatgc ttctaagttt 
gttattattt atttctgaga ctaaaattgt 
tattttagga tggaagttcc agctctgata 
ttaaccatag cagtggctct gacgattcag 
cccttgtttc tttagagatg tccgagatcc 
ggctctactt tggaagctct tatgaatcag 
tatcttgtgc agtcatcatt atacagttct 
tgcagtgatt tctctcctaa ccagccccac 
aaaatagtct tgtttcttgc ttacactaat 
aagacagggc tgggagcaag gaaccaaagt 
ttgaggtttc tcttacctag tggctttaaa 
aaacttaaat tctgttatca tgaacagttg 
aagaaattcc tgaaaacaaa gtgttatctg 
aagtgtactg ataatgtttc aacaggaaag 
ttctactagc attcaacatc tcttctaaaa 
tacatgtaac atctgtacat gtgtttggtt 
tgctttatta atttaggctt tttttttttt 
cagactagag tgcagtggca caattatggc 
tgattcttcc acctcagcct cctgagtagc 
gctaattttt gtatgttttg tagagacgag 
actcctgggc tcaagctatc tgcgtgcctt 
gagccactat gcctagccta actcagactt 
ccaagaacag taaggtggtg gtttaatttt 
tttagaaatg tcccagaaac ttagtataac 
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ttcagacaag gtctcacttt gtcacccagg 35340 
tgcagcctct atggcccagg ctcaagcaat 35400 
accacaggca cacgccacca tgcccagara 354 60 
gqzctccczg zgttgcccag gccttcttga 3552C 
aaccccccaa agtgttggga ttacaggcgt 35580 
gattttcatt cattttccta tatatattat 35640 
aaatagcagg ctgttggtac atttctcaac 35700 
ttaatttatg aagaaaatca taagatacac 35760 
ttatttgtta aataaatttt uctcctttca 35820 
cagtgactct ctacctctgg cagatgatgc 35880 
ctcctttact ggagctgatc tgaaagcttu 35940 
tggaatgctg ctctcgagtg gactccaggc 36000 
tatgagtgat aaaagaagta caatgtcaaa 36060 
acaactttgg caaaactgta tagaaacata 36120 
ggaatatggg ttttgcagag aatttataat 36180 
taccttaata ttggcaaaaa catgttggtg 36240 
catgaattaa atactacaaa caaaaataat 36300 
uttaaaaaat aatcagttaa agttgttgtt 36360 
caggagcccc ttttgtatgg ctcctgtatc 36420 
acttcctcac ttccagarac agtaagttat 36480 
aatcccagca ctttggcagg ccaaggcagg 3654C 
ccatggttgc acaaactgta cccactatgg 36600 
aattcaaaaa ttagctgggc atggtggcac 36660 
ctgtggcagg aggatcgctt gagtaaatcc 36720 
cactccagca tggatgacag aatgagaccc 36780 
tatcttgtac tttctgtatc ccagccctag 36840 
gattttaata tttacagtag atatttgaac 36900 
ctaggaagga ttattctatt actcttcttt 36960 
tacagtttct aaatcagaaa ctccctaggt 37020 
ttccctctcc ctttactacc agaaaggtgt 37080 
cactctataa catggttgat tcatcatttt 37140 
gacataaaaa taaagcccag aggtctgagt 37200 
tggttggtaa attatctaca cattctatct 37260 
accatgtgcc tcaaaaccgt tagagaatta 37320 
cttgtattgc tctaatagaa tgctatctat 37380 
ttacatcttt aaactggttg tccttttgtg 37440 
gtgacctaag tctgtcttca atggtctttc 37500 
ctggagatgg agaatgtggc ttagatcagt 37560 
ttccagatga atcaaaattc aatatgtacc 37620 
aacttggaaa tggaacctct tctgatttgg 37680 
gaaatataaa gctatatgtt ggtgtaaagt 37740 
atattcttcc tggttggttg gttcttcagt 37800 
tggtaatttg cattccttgt taagattttc 37860 
agcgcgtggt tgtgattacc tttggtttct 37920 
acatctttag gagcagttcc attttatagt 37980 
aggataatga ataatttgat acaataatgt 38040 
tgatactttt gctgcatagt aagcacaatg 38100 
tgttttgatt aaatgtgggc agtatcactg 38160 
attaatagtg gttcactgta attttattgg 38220 
atctatatgt ttcctggttt tttgtacatt 38280 
ttttttttga gacagtctca ctctatcatc 38340 
tcactgcagc cttgacctcc tgggcttagg 384 00 
tgggactaca ggcacatgcc accatgccca 384 60 
gtttcaccat attgcccagg ctggtctcaa 38520 
gacctcccaa agtgctagga ttacaggtgt 38580 
taaaaatata aaagcaattc atttttattc 38640 
agtctttaat tctgttttta atttattcta 38700 
tttactttct gaaaatgaag aaacctgtcc 387 60 
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ttgggcatta gtgtgttgga tttaagcaac 
caattttcac ttgatggtgg ttctataaca 
acaacttttc agcttgctta atttcagtta 
tttattgctt aaaatgttta atttttatat 
tcttccttcc atctttcatt actacaattt 
ccaagctcca tgactcagga tttgcctgga 
cctccagtgt taaggacagc ttcacaagag 
gatcaactga gggcagatat cagtattatc 
tggctttttc cccctcatta taattgttaa 
tatatatttc tttgacttat aaacgagcta 
actcagtcat ggttatgtgc ttccttgctt 
acgtatggtc tcttgaaaaa actgacaata 
tttacatcct taatttaact cttcgtcaat 
tgaaccaacc aggaccaatc aaaaccagac 
cacttggtca cacaagacca tccattagtg 
aagtaacaga ttctgttttg gaagtacagc 
aaacctttaa agttcgtgtt taaaataaaa 
aaatatgtgt cgtagctatg cattaaaaaa 
attgagtttt cattaaccag ttcatttgat 
taattttagt aactttgggc tgggtgctgt 
aggccaaggc aggtggatca cctgaggtca 
gaaaccccat ctctactaaa aatacaaaaa 
tcccagctac ttgggaggct gagacaggag 
agtgagccga gattgcacca ctgcactcca 
ctcaaaaaaa aaaaaaaaaa atttagtaac 
tgaaagtgat tctaatgtat agtttataaa 
caaaataatt tatattaata ttttattgac 
ttcatttgtg gaccacattt gttatacatt 
tggccaccta tgcatctgag acccatggac 
tgattcaatt taagagatgt ttattcctgg 
attttgcagt actttgaagt atgtatgtat 
aaagaagaat cagaaaacag aggtaaggaa 
ccacctccca aagcatattt gtttatatgc 
agtctgtaca tattgctata tagcagtccc 
ttacatttta aatgttaact actttattgt 
ccacaatatc caatttttag acatttaaat 
ttgcagctga atatatgcac atatctaatt 
acagggagct cacatttttt aaggcttttg 
actgcaccat cactaacatt gtgtgttgca 
tagaaaaatg atatcaataa tttacatttc 
catattattc attgtcattt gtattttatc 
tccgttttct attggagtgc aactttattt 
aatttttttt tctagtttgt tatttcccgt 
acaatccatt atcttttgtt ttgtaatggt 
ttttttcaga tatgaaagct ttcaaaatcc 
gtttcgacct ggacagaaag taactttagc 
gttaagtttt ttgatggctt ttccatatgt 
ttcttcttaa tttaacaaat ttggttaatt 
ttatgtaatg atcaggattg agattaatac 
tccatatttt atttcctaaa atctaaattc 
gtggaactaa tttatttctt ttgaggaaaa 
tcttggaatt cccagttgta tattcatcac 
gcagcttctt cactgttttg aaataaaata 
ctttgtatat caaaaaatgt gaaatttaca 
aaccagaaat gaaatcacat ccctctacta 
taaatgacat ccattcctct cctagttcca 
tatgaactaa attataaagt tagccaccat 
tatatagtaa tggggraagg gaacagcaaa 
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aaagttaaaa aaacctaccc tgtgttatgg 38820 
caggtatcag tgaaccttta taaaagatga 38880 
attaacatgt atacttatct atgttaatgt 38940 
ttggtaaaca gatagttttt tctctccccc 39000 
accatgcaga gctcacaatg tctctctgca 39060 
gttcctggga aagaccagtt gttttcacag 39120 
ggttgccaag aacttacaca agaacaaaga 39180 
aaaggcagat accggagcca aagtggagta 39240 
aactccttaa aaattgtttc acccttttga 39300 
tatttataaa caagggacca gaacacatta 39360 
tcaatgtttc attaccttat aaggaagaga 39420 
agaagtaaca actggactac cacatttttt 39480 
ttcttttttt acttaaggag gacgaatcca 39540 
tggctattag tcagtcacat ttaatgactg 39600 
aagatgactg gaagaatttt gctgagctgt 39660 
tactattaca agtgacatag tattacactt 39720 
atattttgaa tatttaaaag ctaattcaaa 39780 
ccccaaaatg tcagaagtac agaagtcaaa 39840 
tatatttgaa ttattcataa tggactcatt 39900 
ggctcatgcc tgtaatccca gctctttggg 39960 
ggagttcgag gcaagcctaa ccaacacggg 40020 
ttagccaggt gtggtggcat gtgcctgtag 40080 
aattgcttga acccaggagg tggaggttgc 40140 
tccagcctgg gccacagagc gagactgtgt 4 0200 
ttcgaagaaa taagaaggaa aattaaaagt 40260 
attttgttat aaaaatacct gttttgcctt 40320 
ctcaagaaca tttaaataca ttcagattta 40380 
ggatttaaag gatccttgca attgagttta 40440 
tgggaaccat tctaggtcaa tgattcagtg 4 0500 
tctttagaag ctgctacctt ttgttatcta 40560 
gtgtacatac gttagtgcta tgtatttatt 40620 
aaataaggaa acaaatttct gttaagccca 40680 
ttatatatgt tttcctatta tggtaagaac 40740 
cctttatcca catacatcct gaaaattgtt 40800 
ttttaaatgt cattttatag tgtagctatg 40860 
tgctcccagg caatgtggta atgaacattc 40920 
gtttcactag gatagaggtg gaattgtata 40980 
aaatgtattg ccaaattgcc tgccagatat 41040 
gtatttttct aaacttggcc cttttgattt 41100 
tttgattaaa gtgtagaagt tataattttt 41160 
ttttctaact tgtctcttca tcccctttgc 41220 
gtaagaattc tttttaattt ctgtgactgg 41280 
tcatttctta aaatataatt gtgtttgcca 41340 
agtatttata catattaaat tatctctttc 41400 
aaagaggaga aaaaatcaaa gtggaacaat 414 60 
ataaaatata cttctttttg atttggttct 41520 
tgtaacagga aaaaaatggt gtctatgaat 41580 
tataaaatca cagattggta aatgctataa 41640 
tgtagtataa attgggacat tataacagat 41700 
agtctttaat gaaataatat tagccaaatg 41760 
gataataaag aatgtaatta aatttaaatt 41820 
ctttgtagca tttgacaaat tttatgctta 41880 
tcctattacc tactgataca attatctgtt 41940 
cataattcaa atacatttaa ttatccgctc 42000 
tactacatcc agctccaagc ccaagatatt 42060 
gttatgattt tatcttgata ttctctcata 42120 
caatacaatc tgcgtatcta atatcttaac 42180 
aaggagaaca ttaattaaaa tatacaagta 42240 
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agcctgggca acatagtgag accccatctc ttaaaaaaaa aattagccat gcatgatggt 42300 
atgcctctag tcccagctac ttgggaggct gaggtaggag gaccacttgc tcccaggagg 42360 
ttcaaggttc taaaccagca aagctcagaa tcccagggga tagaaacaaa gacttagtgg 42420 
atcactagta ttaaactgag acacgtcacc ctgcattgca ctttgtttct cagttctttg 42480 
atgaaatcac tgagctgaca tacctgccct cttttcacca taaagtgagt ttcatgatca 42540 
gaagcaatgt ctatgggata gcctaacaaa caatgtaaaa accatttagt aagttcatga 42600 
agggtggtgg tggtaaaaat ttggagaaca tacaaaacaa atacaattcc aaggtgtgtc 42660 
ccctccagga aggacaaatt gctgcctgct ctgtgataga agaggatcag atgtaatcaa 42720 
cctgccgtca gacttgggct gttctctcct gggtgtggac ttgcctggtt ggtcactgct 42780 
gctgacaagt aggctgtcaa tatagctggg ttgtcatgtc agctgtggtg agggggaagt 42840 
ccacattgtg gaggccacat ccctgcactc ttggccaatt tgaccatgaa tcttaagcac 42900 
tggggtggct ggaaaagaca gccgattgac atccatacag aggtcatctt' gaccacttga 42960 
ttagtataag cactgaaggc ttttaactga gcattcacat aggacacaaa tattctgatt 4 3020 
ctttgggccc attccaagaa ctctgggcat acttttcctc cagacctcat acccagttgt 43080 
gttctttcca aatttctggt catctggtta tgttattagc cactatctgt gaatcagcat 43140 
agatttttat atcagacatc tctacctcct gacagaatgg aggagatatg ttacttaaca 43200 
attctgttcc cttggaagat ttcctgtctc cactgtttgt aagggctact ccctcaatgt 43260 
agcagtaatg ctttcactct gatgggaagt cacagtggaa ttctgggtct ccaagaatta 43320 
gtgttagtgc atacacagtg tctgataatc cccagagtgt ctggtgccct tggatcctgt 43380 
gaagaaggct tggagaaaag aagattcatg gcaagaactt gtgatgtgat gacagggcct 43440 
tttctctggc tcttcattct tagtctgacc taggtgtgag aattaggrca ggggccatga 4 3500 
ctatattgtg gtgactcaaa ccaggccttt gtttactaac tgggagattt ttacattgta 43560 
agaatcaagt aggatctttg cccatgtatt ttggtcttaa gaacacaaat gatatggctc 43620 
caatgactgg aggaacacca gggtccttgg tctcacgctg atttagataa aacgactgtc 43680 
aggcctctga gcccaagcta agccatcctc ccctgtgacc tgcacgtata catccagatg 4 3740 
gcctgaagta accaaagaat cacaaaagca gtgaaaatgg cctgttcctg ccttaactga 43800 
tgacattcca ccattgtgat ttgttcctgc cccatcttaa ctgagcgatt aaccttgtga 43860 
aattccttct cctggctcaa aacctccccc actgagcacc ttgtgacccc cgcccctgcc 43920 
cctaagagaa aacccccttt gattataatt ttccactacc cacccaaatc ctataaaatg 43980 
gccccacccc tatctccctt cgctgactcc tttttcggac tcagcccgcc tgcacccagg 44040 
tgaaataaac agccttgttg ctcacacaaa gcctgtttgg tggactctct tcacacggac 44100 
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aagctttagt agagatctca aaaatggttg gatggtagca aattactaag aactctcaaa 60 
gtttctaaag ccttagtttc agcttgctag aaaacctatg ttgagtatta tggctagttc 120 
catagttgag ttgggaaatg tctttgagga gacacttttt cactttgtat tcatctgtac 180 
attttctgtt acttgcattc tgtcatgctc aggctattag agcaggtaca tttttataac 240 
tggaatgttt atgtgtagtg aagctctgag aggactttgc attagatctc agcagcataa 300 
tcagaaggtt gtcctttgtc tcagcaattt ttaagctaat agtagcagaa attgcagtgg 360 
aaatagactg ctttgccaca acattcagaa aatcatttat ctttttattg cagttcttgt 4 20 
caccaaacaa tacattttag tacttctcaa attgcagaac tctcataggg ctgggaaaat 4 80 
gcctgtagac acatacatac tatgaatgtg ctaatgtttt ttgtattttc atagcccatc 540 
aaagctcctg agtcagtttc cactataatc actgcagaat caatcttcta caaggtaagc 600 
ttttgtagag ttaqtgaagg aagagttggg cctagtgggt aatgtgccac taaaatgttg 660 
gattagtcta aaggtctctg ctactcttta tttgtataag gtgtgattat actttttgtt 720 
cccttcttag ctgttttccc ccataagtgg ctgttattaa aacatctcat ctagagctga 780 
agtgggagga gaaagtgcct actgacacat gatgtgagga tcttaagtat ttttttttag 840 
tgtagattgt aggaattatt cttaaaatgc tgattgtata gtgtggagcc atggaagact 900 
gagccgttag tgcgatggca ttgaagaatg agaaggacag agacaggatt tggactagta 960 
gaggttgtcg actgtggtgt caaatgggta gagtaggccc agagattcta aaatgccttt 1020 
aagtggagtt gagctgagta agggcagtag tgaggattaa cacctactag aaattcatag 1080 
tgagaggaat tccaagatgt tttgataaaa gaatgaggag gtcaggtttc ccagggccaa 1140 
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agtccatgaa catctgatac ctcagtgaga 
agtcttagga aaggaattag aacatagacc 
ggcagcaacc actgaaggct atttggtgtt 
tggtgtgagt tagtacttta tacttgaccc 
ccttaagtat actttttttt aagcccacaa 
aggggtacac tggcattccc cagcagggct 
cacaggcaaa catctctctt atttttccaa 
agtttagcaa acagttgctg tgtatcagcg 
agttcactct atgaggtgga tactactatc 
agcgaggtta attaacttgt ccaagatcac 
tcatgccaga gcttaagcct agagcatagt 
gctatgtgac gaggaccaac ctctctaatg 
ttactacctc agtgggtcaa atgaaatcat 
caatgaatag taggagttat cacatcttcg 
ttaaggccag aagcaacttg ttgagctacg 
tctccatgga agggtgtgtg ggacccgtta 
ctgccaccca tgtttattaa atgataagga 
tgcaaatgcc cagtattgta gtggctatca 
tggcaagttc aagaggtcac tgccagccac 
ggagcctgag tgggagccac tggggatcac 
atggctgagt ggcctccctg gagcatggca 
ggtgatgcct aaactagtgc tgttctcgtg 
atcctctcag caaatgagga gactactcag 
tatgtgtaca caacacagca catattaata 
cactggaatc tttcactaag acattgtttt 
agtagatgtt ttggattcat attcattcag 
gtaagcctat gataagcaag tattctcatt 
gacaaacaaa ccataaatgc aaactattta 
gaggaaggac cagctattga tgggtaggaa 
accagaccca tccgtagtga tccagatgaa 
tccaccagga aaaaactcct ggcctatcag 
atttcctcaa aagtgttttt atggttgagg 
agtccctgtt tcaagggaag cagcaatgaa 
atcttaccaa gaactatacc cacttaagga 
ccattatggg tgttcagagg agagattatt 
ggatggatac cagagtcata gggaggattt 
ggtataaagt ggaacagaaa tgaatgagac 
gtcctgttgt ggaaggatat aaaactcaac 
ctaggagatg tacagtaggt tgaggtaaac 
ttttggtttg aatttgtttt ggtttgaatt 
tggggagggt ggcatgtaga atgcattctt 
agagaaaaga ctgctgagct gatgtaggag 
agccgtttaa ccttactact gcttcatgac 
cacagaggat ttttagggcg gtgaaactat 
tgggtacatg tcattataca tttgcccaac 
cctaatgtga actctggtct ttgatgatgc 
gtgtaccact ctagtggtgg gaggggttat 
ggcaggaagt atatgggaaa tctctctact 
tctgtaaaaa ataaagtcta ttttttaaaa 
caaaatactt tatgaacaaa tcttttctcc 
atgtgtatgt ataattttca ttcaaacgtg 
aaacactgat acattagact atctcgaaca 
acctattaag gttcattcat agctgtgatg 
ttctgtttcc cccagggagt atattaccaa 
caagatggaa agccctacta tgctcaaatc 
aagagtgcag cactgacgtg gctcattcct 
cccgcctcct atatcatagg taagtttgac 
aactctccaa tattatgtaa aagagtgtgt 
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gaactgacag actgttctgt ttaaaccaga 1200 
cccaaggctc ggcaggcctg gcacggcaca 1260 
tcgggatctg aactgtcatt taggggacag 1320 
aggtggactg agaaactcaa gtgatgatge 1380 
tctatatagt cgaagtctgt tcctcccaac 1440 
gggaaaaacc aacaacaaaa aaagtctgta 1500 
catrzaatac attgttaata aaatatctaa 1560 
gctgagcatt ttgcatgctt tatttcattc 1620 
cccartttct agatgagaac attgaggcac 1680 
atagccaaca agtcatggag tgaggcagcc 1740 
tcctggctct acagcrttag caagtgactg 1800 
tctcatctgt aaaataggaa ttgtaaatag 1860 
atgtgttaag cacttagcag agtaagcact 1920 
catttgtgca ttaccttcac agtttacaga 1980 
ggtttagtgt actaacagtt tccatgtgtg 2040 
ttgtgactgt ctgtactttc gtattgttgt 2100 
caataatgca acaaagtagt caagtaatgt 2160 
cagcagtgcc actggcaggc agcaccatgg 2220 
tgagctagag cccagatcag gcatgcaaga 2280 
ggccaagagt gtgaccaccc aagacccaga 2340 
gtggcagaac aactccatga actcagatc- 2400 
tggacccctt ttctctacca gaaaccttga 24 60 
atcagtgact tagtcctgtt tggtgttata 2520 
aatacctact atgtgccagg cactgcctac 2580 
tactttgcat ttctgccttt acactatgaa 2640 
catacatttg aatatgctgt gttatgcata 2700 
tagaatttgg gaatattgat tatacatgtg 2760 
tatgataaat aactttggac tgatggctgg 2820 
ctagcaagta gcggactgtg gcctgcatag 2880 
acagccaccc tcagacactt ggataaaggg 2940 
gtgctatgtt acagttcagt tactggaagt 3000 
tacacattcc tacagcttta cctgctgcca 3060 
ttacactgtt cccgtagtca aggacagtat 3120 
ggtgccggat gccataaaga tttggatcaa 3180 
tccagctcaa gacccaggga agaggacata 3240 
aacacaggac atgtacacat tagttagttg 3300 
acaaagcctt gaatgccaga aatactagta 3360 
tgggagtgga agagaaaggc agcagtgagt 3420 
atatcctgaa gactataatc caaagattat 3480 
catggtatct attttctttg agtggatggr 3540 
accaaatcag catgattttc aagacagtac 3600 
ctttggctgc agtctctatg gctttcagca 3660 
tgtggctaac aaagtaggga tagtacggag 3720 
taatactctc tttgtatgat actataatgg 3780 
cccacagaat acacagcacc aagagtgaac 384 0 
tatgtcagtg tacgttcatc cgtgtaacaa 3900 
tgataatagg ggaggatgtg catgtgtggg 3960 
tctgctcaat tttgctgtaa acctaaaacc 4020 
agtggggatg gtattacggc aatataaaat 4080 
agatgtaaac tgtcatatat gcaccctcgt 4140 
aaacaacttt agaattggca ccaaacatat 4200 
ccttttactg accactttga aaacttgctt 4260 
ttctattttt attttcaatg tgggattatc 4320 
attggtgatg ttgtttctgt gattgatgaa 4380 
agaggtttta tccaggacca gtattgcgag 4440 
accctctcta gccccagaga ccaatttgat 4500 
aaatggcaca ggtttttttt taacttagtt 4560 
tagtcagctt gggctgtcag gacaaaacat 4620 
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cacagactga gtggcttaaa caacagaaag 
ccaacatcaa ggtgctggca acacggatct 
tggtcacctt cttgctgtgt cctcacargg 
tcttcttata aggacaccat ttctgtcaga 
ccttaattgc ctccctaaag gtctcatccc 
caacatataa atttggaggg tggcgggggg 
atgagtatta ttaagtacaa aaaaattaga 
gtagctggag tgtgagtgct atcagttatt 
agtggtatgg ataagatttt tttggagtga 
tcgctcagga actaggttat ttaggttact 
aggaaagaac tatcccagtt atcccatact 
gctacacatg tcatcttagg cctttatag- 
tgtgcttttg ttaatttcaa agctgccaaa 
ctgattaata caatttttaa agttttcaga 
tctgcagtga gcatgcatca ttacttttgc 
gagagaactc cagggacaaa taatatacca 
tacattacca aacaattcta gccttctgct 
tctatggatc aggatctcag cagaggcagt 
tactgcctcc tctttctaat ccccagattc 
gcatggcatg aggtcagaac accagttctg 
atttaccggc catgtgactt tggcaagttt 
tgtaaaatgg gaataataat agtgcctacc 
tgatacatgt aaacttagag cagtgtgggt 
actgtttttg ggagaatgcc atattcttta 
taatttcaaa gtaatgcatg tttcaagggc 
cccagtgtct agaaatttta acatcttatg 
aacctttccc ttggctgcct tccagggcca 
ttggaatttg tttgtcatgc accttctgag 
acagttccca ccagaccaga gaagggctac 
ataacaatta aggaatcagt tgccaaccat 
aggcctggtg tggtggctca cgcctgtagc 
gggcaatgga gtcagattct ctttcttaaa 
ctaatattct tagtaccaca agatatgtca 
aaaagtgact aaaaagtttt tctcctgcta 
tggtcactta gaaaattaaa agggataggg 
agcactttta gaggccgagg caggcggatc 
tcaggagttc gagaccagcc tggccaacat 
aaattagcca ggtgtggtgg catgtgcctg 
gagaatcgcc taaacccagg aggtggaggt 
ccagcctggg caacagagtg agactcttgt 
ggcacagtgg ctcacgcctt taatcccagc 
tgaggttggg agttcgagac cagcctggcc 
tacaaaaatt agccaggtgt ggtggcgcac 
ggcaggagaa ttggttgaac ccaggaggcg 
gcactccagc ctgggtggac agagcaagac 
aagggataga atataatgaa atatattttg 
cctaggcaaa agctgtaatt tccagagaga 
ccattattta tttctagaaa ctcataaaat 
taattaaggt atagatgact gaccaagggc 
tcataaagcc acacaagcct tatgttctca 
gctttaacca taagaaaaat gattggtgga 
ttcatctagg ccacgtgcgg tggctcatgc 
tggatggatc acttgaggtc aggagttcag 
tctctactaa atatacaaaa attagttggg 
ctcgggaggc tgaggcagga gaattgcttg 
agatcgtgcc actgcactcc agcctgggtg 
aaagaaaaaa ttttaattta atccttctgt 
tcttaataaa gctgctcttt actgtttcta 
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tcactttctc acacttgtgg aggctgaact 4 680 
ctggggaggc ttttcttcct ggcatataga 4740 
cctrtcatgg agtgagagct ctttggtg^a 4800 
cgagggcccc accctcatgg tttcatttaa 4860 
caagtaccat cacatcgggg attagggctt 4 920 
ggatgcaatt cagtccataa caaaaaaagc 4 980 
gagctttata gaaaatatga ggcattttat 5040 
ttgagttaga gcaatgtgca tctactaaga 5100 
cccagggtta aactgtacta caagaatgta 5160 
tatttataca aacctattca aaaataattt 5220 
tgcaaattct caatatgtgt gcctctgcat 5280 
ataaaggctg atagttgaaa tggcagctgc 5340 
acagctgtga gatagactca caagaattta 5400 
tttttacagt tacttcagac tttttatctt 5460 
atcctgagaa caagcataag tgtgtttttg 5520 
ctgttattct cacctatatg tcaagtttga 5580 
tataagtata tagaattttt atttacctta 5640 
gatgtatcag aatcaccttc gggattcctc 5700 
tgatatgcat ccttgtccta cagcgaggca 5760 
gagccagact gtctaggttc acagcctgcc 5820 
cttagtctct cttgcctcac tttcctcaza 5880 
tcagaaggtt gatgtgagga atgaaggtat 5940 
acaaaataaa catgatgcaa gtgttcaatc 6000 
agccgttaaa gaagaaaaaa tgattaagaa 6060 
taatgccagg ttgctcccag agtggtctct 6120 
aaaatgatat atatggtcaa aaatgtattt 6180 
gaggaagatc ttccaaggaa gatggaatac 6240 
tatttcaagt cacggtcatc accatttccc 6300 
atatggactc atgttgggcc tactcctgca 6360 
ttgtagttca caaattaaaa ctgggtttcc 6420 
cccagctatt gcaccactgc tctccaagct 6480 
aaaccacaaa aaaactggat ttccagttct 6540 
taggtatctt taaatgaaat tcttagctgg 6600 
cctagtaata aacaaatcat tgtttattac 6660 
ccaggcacag tggcttatgc ctgtaattgc 6720 
acctgaggtc gggaagtgga tcgcctgagg 6780 
ggcgaaaccc cgtcgctact aaaaatacaa 6840 
taatcccagc tatttgggag gctgaggcag 6900 
tgtagtgagc caagattgca ccgctgtgct 6960 
ctcggaaaaa aaaaaaaaaa aaaaaggctg 7020 
actttgggag gctgaggcag atggatcgcc 7080 
agcatggtga aaccctgtct ctactaaaaa 7140 
acctgtagtc ccagctactc gggaggctga 7200 
gaggttgcag tgagcagaga tcgtgccact 7260 
tccgtctcaa agaaacaaac aaaaaattaa 7320 
aacttaaatt atattctata tgtgtatctt 7380 
ccattaggaa caggtagtat ctatttttct 7440 
ggattgtatt tttctataag aacaaaatat 7500 
ttaatcaaat aaaatgacta acagcatcta 7560 
tctcaaaaat gctgtgacag ctttttggct 7620 
tgattttatt agcccaggct tttaaaaact 7680 
ctgtaatccc ggcactttgg gaggcctgag 7740 
gaccagcctg gccaacatga tgaaaccctg 7800 
tgttatggtg catgcctgta atcccagcta 7860 
aactcgggag gtggagattg cagtaagccg 7920 
atagagcaag actgtctcaa aaaagaaaaa 7 980 
agaaacaggc attcagaacc attccattga 8040 
gtcaaaaatg agacttcgat caaaccataa 8100 
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gattttatac tgcagatagt cagcttcacc 
gcttcctgct tgatagtctc ttgactacca 
cattggtagg ccattagcat tgatatcttt 
acccataata agaggcctgt tgtatatgaa 
cggttaagta agggagcaac acgtaaaatg 
ctcttttgtc ctgatttaac cagcattttt 
tgattgtaat gattttgagc tgcagcagct 
ggtgtttgag ttggaaagaa acaactatag 
tcacaaaggg tatagtaaaa ttgattgtaa 
tttggattaa aatgtatttt tcaccgtgca 
caatttaaat ggggctcttt aaccaaaaat 
agaatttgga gtagaggccg ggcacagtgg 
gctgaggcag gcggatcacc tgaggtcagg 
cccgtctcta ctaaaaatac aaaaattagc 
gctagtctac tcgggaggct gaggcaggag 
agtgagccga gatcgcgcca ctgcactcca 
aaaaaaaaaa aaaagatttt ggagtagatt 
atcaaaaaat ggctaataaa atgaacacaa 
aaaaatctat aaattgatca tctgtttata 
aaataaagat tgaatttcac ccagtgtgat 
ggccggacct gatatggccc tggtctgtgt 
atctttcccc tgtatgcccg cccaattttt 
ctccaattct accttccaaa ggcctttctt 
tccagattcc catgcctttt tggaatcaat 
ctacttccat catcctcact cctatccctt 
tatttactca tctttgtaac ttccacataa 
ctgattgtag ggtctgagtt agatactgtt 
taattcatac taactttggc tgaaactttt 
tagattgtta cattctgggt tagtattaga 
ttttaagatg agttttaaat agttctctta 
aggaaattat cccaaaccat tccagttcct 
gttttccact tcagccgtaa gtaggtgaaa 
tttgctttat acacatgcat gtgtgttgtg 
tgaagtttct gtcatgccca gaaaagggag 
ctggggatgt ttgaagaact gtgctgttta 
ggtaggaggg tatacctcct acacccaaga 
agaaggaacc caaatgaccc acaagaggtg 
tgcacagtaa tttatttaag cacctcttaa 
agcggaaagg ttcacaataa ataagagaaa 
ttctgcaaac aagaagcatc ttttataaaa 
gcctgtaatc ccagcacttt aagaggctga 
atgattgtgc caccactcca gcctgggtga 
aaaaaaaaaa aaagacggaa attcctccag 
agctactttt ttcagcttta tacttcgcag 
ttttccaaat tttttacaat aagcacacac 
aactggtggt gaacaaccgc tggcttttag 
gtagttctta aacccttgaa agggagtgaa 
tcattatttt cctatattca catcatgatt 
agcttcagcc actcctgggc caggcgcatg 
ttctgcaggg tgcctgtatc atctgaattg 
ggttcaagtt tttctttcct gtcctccact 
cgctgctgac ttaaggcccc aacaccaaac 
agcaagctcc aacaattgtg taaggtaaag 
tcctagtggt tctgtttctc tgatcgaatt 
agagaaggca aggaactact gtttctcatt 
tttgctatga atatgtagtg ctttgataca 
cacataggga aagatagatt ggattatttt 
gaataaaatg ggagaaacag ctccctcatg 
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aaagccgcag aggaaacatg tcgagatcag 8160 
ttaaaacgaa tattgggagg tcatgaaagt 8220 
aaaacatcta ccctaaacca tctgctatgg 8280 
attgtctaga attcaggtgc aggt-ctttgc 8340 
ggagaggagt ggggtgtact cacttgcctc 8400 
caaccctggg aaaatttgca gaatctaagt 84 60 
ttaactctta ccctttttcc acacagttat 8520 
gtagctacac gtacataact atctctttat 8580 
ataactttct aagtgccaat attcaaaact 8640 
tttactttgg atgtatttat ttcatttaaa 8700 
ggtatttaaa accaaaacag tatcgtactt 8760 
ctcacgcctg taatcccagc actttggaag 8820 
agttcgagac cagcctggtc aacatgaaac 8880 
tgggcgtggt ggcgtgcgcc tataatccca 8940 
aatcgctgga actcaggagg cagagactgc 9000 
gtctgggtga cggcatgact ccatctccaa 9060 
catcattaat aagtaacaga ttttaggaaa 9120 
tgtaaaacat ttattaaaat gtagactttt 9180 
aattggcaga tggttgtgta ccatctttta 9240 
ggttcccatt gcttatattt ctcctgctga 9300 
tcccagcctt gtttcctcat taccactaaa 9360 
ctggctctga gtccttgttc atactgttct 9420 
aacaccttcg gattctttct ttgagaactt 9480 
ctctatccta ttgtcatcac atttaagttt 9540 
tggtcctggg atgacaggga tgctgtgttt 9600 
cctaaccccg gttcttgctt atgggagatg 9660 
aactaaaatg cttgttgata ttttagttat 9720 
aaattctatt gtgaatagtc aagtaaaatt 9780 
ttgtttttaa gattgtttta aacaagatgt 9840 
acacaaataa agcttaatat gagtatttga 9900 
ggctgtgaaa ggcttttcca ggcctaataa 9960 
tcaaatgaac aatagaggga aatgtattta 10020 
tctacatata aacattgcac acgcttagaa 10080 
aggcattttt gtggattttg tctggctgcc 10140 
cttcatacca ggtgtgtgag ccataccttt 10200 
aatataagcc aggagaaggt ctgtgccaag 10260 
ggccattaat tattgggtca gatgcataaa 10320 
tggtgaccca caaggaagat tgctcgtagt 10380 
aaagcagaat gtagaactgt atgatagcaa 104 40 
gatggaagga gcccaggcac agtagctcat 10500 
ggtggaggat cacttgagct gcagtgaccc 10560 
tagaagtgag accttctctc aaaaaaaaaa 10620 
aattttaaca tgtcaacaga ggttttctgc 10680 
tattttccaa attttctcta acaagcagta 10740 
acacacacac gtttgtttgc ataagtgccc 10800 
tctatacata tctagaatat tttataaata 10860 
tgaccagctg agaaaataaa gtcagtgatt 10920 
ctaggaaaga acttgggagt gacttccttc 10980 
cttagctctg tggtaaaggt caccagcttc 11040 
gaggtttggc gagggtaaga gactgatgta 11100 
tgaaatctgt cttcccttcc agactgcctg 11160 
acagaagcaa cagccttaca cagagtgttc 11220 
tttcctttat agattccttt tctatatcgc 11280 
ctggctgata acagttgctg agactctgaa 11340 
ataaactgtt tagaattatt tggccatctt 11400 
ttttttaaat caaaaagtaa tgaaagagat 11460 
taaagtttat atactaaatt gaaaagcaaa 11520 
tggctgttgg caggaagctt ccattcctct 11580 
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ctgtgggcct ccacaggttt gctcacagca aatggtccgt gacagaaaga cgcaagggca 11640 
gttgcaccca agatggaagc caccatcttt tctataacct aatctgaaag aagggacata 11700 
ccagcacttc tgccatatgc tgttgggtca cacagaccaa ccctggtaca gtgtgaacac 11760 
aggaccacac aagggcgtga attccaaggg cagagaccac tagggaccac ctcagaggca 11820 
cagagggaca ccctatccag ctggtggcca atgtaaatta acatagcttt ttagaatagc 11880 
aatatgtatc tataatctta aaagtattaa aagtacctct tgatccagta atttcatctc 11940 
taagaatcca tgctaagagg atttaaaatg tggaccaaaa aatgggtata aaaagaagtt 12000 
gttaacagta tttaaagttg tgaaaaacca gaaacaatct aaaggtccaa caataggaaa 12060 
atgaattttg atatttttct aatagaattt tatgctgtca tcagaaatac catttacaaa 12120 
taatttttaa taacgcaaaa aaaagtttat aaaatgttta gtgtaaaacc tggacacaac 12180 
tacataatga ttctgatttt gtaaaaaaaa aaaacaaaaa cacacacata tacacacgca 12240 
tacatatgca tataaagaaa actggaacaa acaaaataac aagcatagtt ggaattacag 12300 
tcattttaat attctttatg cttttaaaaa ttttgaagtt tgtattacta gcatccacta 12360 
cttacgtagc caggaaaaaa atacaacttt aaaatagata tttaggtcca aagatggtaa 12420 
tctaaatggt gttacaggcr gaatgtgtgc ctgatcccca tgccccaagt tcatatgtta 12480 
aagccctggc ccccaaggca atggtattag gggagtaggg cctttgggag gtaatcagat 12540 
ttctacgagg tcatgagggt ggagcccgca tagtggaatt agtgtccttt taggaagagg 12600 
agaacagacc aaagccttcc tttctctcct cactatgtaa gaagacagcc agaaggtggc 12660 
cacagccagg aagagagctc tcaccagaac ccaaatctgc tagcaccttg ctcttgggtt 12720 
ctcagcatcc agaactgtga gaaatgaatg tgtgttgttt aaaccactca ggctacggta 12780 
ttttgttgca gcagcccaag ctgacagaga tagaaacaac acaaggaccc atcagcagac 12840 
gaatggatga tcaaaacgtg gtgaggtcgt gcagtgggat attattcagc cgtagaagga 12900 
atgaaattct gatacatgct ataatgatga accttgaaaa catgttaatg gaaataagcc 12960 
aaacttaaaa ggacaaatat tgtataattc cacttatatg agttagttac ctagaatagg 13020 
caaattatgt catagataca gaacattaga ggttaccagg gttgtgggaa gaggggtatt 13080 
gtgggtacaa attttcggtt tggagtgatt ttgaaaaaat tctggaaatg ggtagtgaca 13140 
gtagtcaaca tgatgaatgt acttaatgac actaaattgt acacttaaaa atggttaata 13200 
ctgggctggc gcagtggctc atggctgtaa atcccagaac tttgggaggc caagacaggc 13260 
ggatcatgag gtcaggagat tgagaccatt ctggctaaca tggtgaaacc ctgtctctac 13320 
taaaaaataa aaacaaataa aaaaaaaatt agccgggcat ggtggcaggc acctgtagtc 13380 
ccagctactc gggaggctga ggcaggagaa tggtgtgacc tgggagtcgg agcttgcagt 134 4 0 
gagctgagat cgcgccactg cactccagcc tgggcaacag agccagattc cgtctcaaaa 13500 
aaaaaaaaaa aaaggttgat acctgggtgc ggtggctcat gcctgtaatt tcagcacttt 13560 
gggaggccaa ggcaggcaga tcagttgagg tcaagagtta aggaccagcc tggccaacgt 13620 
ggcgaaaccc catctctatt aaaaatacaa aaattagtcg agtgtggtgg tgggtgcctg 13680 
tagtcccagc tgctgggagg atgaggccta ggaattgctt gaacccagga ggcagaggtt 13740 
gcagtgagtt gagattgcgc cactgcactc cagcctgggg gacagagcga gacttagtct 13800 
caaaaaaaag gttaaaattg taagttttgt tatgcatatt ttaccataat ctttaaaaaa 13860 
tagatatata ggagataaag tcaacagaat ttaataacca gttgtaaata gagactgagt 13920 
gaggaggatg aattaaggaa gacattgagt acaacttttt ggtaggtgaa aaactcttaa 13980 
aaaaatacgt gggcaaagat cctacttgat tcttataatt taaaaatctc ccagttagta 14040 
aacaaggcta ggtggagatt tgcatgtgat gtgaggtgtg tgttctgttt tgtaatgtga 14100 
ggactgtgag ccatctcctg gacttgaata tccattagat aattgaaaat acggatttga 14160 
gaactcagga gacgtgcaat gcagtaacaa aactctgcac ctagttgatt tctgtctcct 14220 
aatttaatgc ttttatggga caaactgtta ggcaggtggg caagatggac agccatattt 14280 
ttgtgggttt ctggcctgtg ggccagcctc agtgctcact ctgaggtcat gtccaaactt 14340 
agaacacatt caggcctacc acagtcaagg ctccctttct caactctagt cctctgcaca 14 400 
aatatccgaa gcctagaaat aataatcatc tgtccttgtg tcttgcatta tgaaagccta 14 4 60 
ggaaagggcc ttgggaatta agaagaatgg aaaaactggt ctaactgctg catgcttcag 14520 
cttgcagggg aatcactgaa atggggacag gccataaaag gacaaccaga agagtggctt 14 580 
cagcaaaggc atcgtttttc agagcaagct agagaatcct gccagcgtcc tcaggcaggg 14 640 
cccctgggca cagaggttag gcaagggagt gtcccagcat gttgatgccc tgagcatcag 14700 
aataatgcca tagaggagct tccaaagagt tcatttcagg ttttgtaagc cgaacatttc 14760 
taggcaaata aaatttgatt ttgtgaataa agcttgtttc ttcaactcca gtgcagattc 14820 
tcatagattg atagtggctt gtgatccaga taaagaaaac aatttttcaa agattcatat 14880 
tctttgtaga tgtacggatt tagagaccat ctaatctaac tccctcattc tacagatagg 14940 
aaaaatgagg cctaaagaag ttaagaaaat accatggaaa tgtcactgct gaactgccat 15000 
acgtaggatc cgaaagaaat tgggtaaatg ctactgtgag aaatacagta ctaggtccaa 15060 
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agaatctaat acaaattaaa aatctaaatg ttatttctaa agcatccctg cacacggctg 15120 
aacttacata gtttcatttt ctttcttttc tgttgaagaa gaggcaartg gctgggtgca 1518C 
gtggctcatg cctgtaatcc tggcactttg agaggccgag gcgggtggat cacctgaggt 15240 
caggagtttg agaccagcct ggccaacatg grgaaacccc atctctacta aaaatacaaa 15300 
aattagctgg ctgtggtggc cgctgccrgt aatcccagct actccagagg ctgaggcagg 15360 
agaattactt gaatctggga ggtggaggtt gcagtgagcc aagaccacgc catcgcactc 154 20 
tagcctggat gacaagaggg aaactccatc tcaaaaaaaa aaagaaaaaa agcaatcacr 15480 
aacctgtgtt gtttattaaa catgacagac tggcatgaag taattaccaa actgtaaaca 15540 
aaaaagctac aatctgccag gcatggtggc tcatgcctgt aatcccccac cttgggaggc 15600 
caggttgggg gatcacctga ggcctggagt tcaagactag cctggtcaac atggtgaaac 15660 
ctcgtctcta ctaaaaatac aaaaattagc ccggcgtggt ggcacatccc tgtaatccca 15720 
gttactcagg aggctgaggc aggagaatca ctcgaacctg ggcagtgggg aggttgcagt 15780 
gagccaagat cgcaccgttg tactccagtc tgggccgaca gagtgagact cggtctcaaa 15840 
aaaaagaaaa aagaaaagct acaaccttaa tctcaacttc tcataacatc atctctactt 15900 
ctgattagaa gagtggaagt ggggaggttt attacaaaaa gactgttata ccttacacac 15960 
ttctccccat gaatagtgaa ggtgtgagtg aaaaagacag caatttratr ttttttttga 16020 
aacaggttct tgcactgtca cccgggctgg agtgcactgt tgtgatcacr gctcactgca 16080 
gcctccacct cccaggctca agtgatcctc ctacctcagc ctcctgagta gctgggacca 16140 
cagttgtgca ctaccatgcc cagctatttt tttttaagag atggggtctc actatattgc 16200 
ttaggctagt tctcaaactc ctggcctcaa gcagtcctcc gaccttggcc tcccaaaggg 16260 
ttgtgattac aggcataagc caccacaccc agccagcagt tttagaaraa agggtgaagg 16320 
tgctgttggg gaaatataat ttaaaaaaca aaatcttctc tcaacccaga aatcctctcc 16380 
atgaaggcag tagagaaaga taagctttat tattgaataa aaattaaatg agaatgtgat 16440 
gcacatcaca ggcactttgc taagagatca caaagacaga aggaaatttc accattttgt 16500 
acagccaagc aggtacagcc cattacatgt atgttttcga gataaatagt cctcaactaa 16560 
gagaacttga cagcaccact ggtcacacag ttcattctaa ctttacctga taattgatgt 16620 
gaccacttgt gttatctaag atatcaactt ttcgggggtg ggggagtgtg gaaacaggag 16680 
ttacttttat agcttggtgc aaggtactca ttaagattag gctgttaccc tcccacagaa 16740 
actggaagat aggtatgcta tctggtaatg tttacatttc ccagatcctt gagaaagaca 16800 
ttcctaggtc ataaagctga caaaaggctg attcagtttt taaatatata tatctgtata 16860 
tgtatttca 16869 



<210> 65 
<211> 15000 
<212> ADN 

<213> Homo sapiens 
<400> 65 

gatctcttga tcccaggagg tcaaggctgc aatgagctaa gatcaagcca ctgcattcca 60 
gcctgagtga tagtgggaga ccttgtcttt aaaacacaca cacacacaca cacacacacg 120 
agggcctttg accactcttg agtagaagac tcgagaagaa caaagtagaa ggccagagaa 180 
gaacaaagtt acttgaaaga tctcttatta aagagaatgt acaagctatg aaaaaaaaaa 24 0 
aacacacaca cacacacaaa cctcatctgg aatgaaaaaa acataatgca tttggtttct 300 
ggttccttag gctgttatgg aacaaccaaa gaacattatt ttggtttctg aggtcagaac 360 
tattttattc ccctcaagca cactatgctt atggtttgag ggagaatgag aaataggaaa 4 20 
ctaggaacag gctgaaatgg tctaatcttg accatctaat tctgcagtgt cttattctca 4 80 
ttctaaaaga gaatggttat attcgctgtt ctagcataaa aagtaatgat aaaaataaaa 540 
gatcccgtat taccagacaa taatccccta gactgtttta atgcttggtt gagtatttgc 600 
ttatgatctc agactttaaa agatggtctc cccctatggt gaagcttgtt aattatgtag 660 
gcatcattaa tgtctgttta cttatcaaaa ttttatcatt gttagttgta ttactacttg 720 
acagtccaat ttatttaatt gaaaagattg gttaacattt tatagtcaaa gtaattgttt 780 
cctgtgtttt ttcctgttta ggttattgga gtgatgagta aagaatacat accaaagggc 840 
acacgttttg gacccctaat aggtgaaatc tacaccaatg acacagttcc taagaacgcc 900 
aacaggaaat atttttggag ggtaagtaag ggaaatttct tcagacccat taaatgttag 960 
gaaaaaatgg agctaaaaga gctgggtggc tcacctttct catcctgtgc tgagaaatgc 1020 
tggggctcac ccataagtat ccagcatccc catggacaca gggaattctg aacaaatgtg 1080 
atgaaaccga tgaaatgtct ggcctgtagg tggttagtga tggagatacg ggctatatgr 1140 
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gaatcttgat ttttgcaatt cattagagct 
ctttaaggat aggttcattt gcatttctcc 
tagatrtcac ccctttttga tttcttgctg 
acaaatgaat tatctttttg gttttttttt 
gctggagtgc aatggcatga tctcggctca 
ttgtcccgcc tcagcctccc gagtagctgg 
attttcgtat ttttagtaga gacggggtrc 
tggacctcgt gatccgccca ccttggcctc 
ccgcgcccag ccaggaatga caaatgaatt 
tagctggaag atgggttgag gggaatggag 
gtgcatggta aaatgattcc atttgacaat 
gcttaacagt catatgcaag atgataagct 
cagtacaatt tcctttgcta tattagggtt 
tggaatcctt gaataaaaca ctggattagc 
ttcttcccat agatgtctca gggatattta 
cgtttttttg tgcatactta catgaaatgt 
ctgcatgata acaaaaattg tgttatgctt 
tatatcgttc ggacaagaag ctattcctaa 
catttttaga aatttatctt actatttccc 
agaatcatgt gctcacaatt tttatttaat 
ctgacttaca atggtggaac catgagtgca 
cagaagxrgag ccacaaaggt gcatagttct 
agcataagtc tcattaatgt gtgattattt 
ccccctcact gtccagttcc ctgtttcatt 
ttccttggga ggatttattt gaatcagtct 
cgtttttgct ggcaggaata tgaacatctg 
tacactgcca aagaagggat gttcaagttg 
tatgaatcag cgcattttaa tcttctagat 
aacggtgttc attttacata tgcgttattt 
cattgctgtt tttaaatgag gatacagtaa 
aacatacccg tagctttaga aagcagtttc 
accccatgtt cctggaagtt tgcacatcag 
gcagaartca cccagccttg ttccattttc 
caagctgctt tgatgaagcc acatgtattt 
taaaagaaag tgattctggt gtttaccgcc 
tctgataacg tttgagcgaa atacagaaac 
gtaaggaaaa gcaataacct gctgtccggt 
ttactgctgc ttggagactg caagtcgcag 
gaaatttctt aaagtctaaa gtaaaggtgg 
ctttgtgtgg aaggataagg agtgtgttta 
ttcttcttcc tctgcctctt tgccaagtag 
ttactctagg acaaacttca aattcttcat 
tcttcctgtt ctttttccaa aaacacacgc 
cctcctccca gataaggggt tcccttccct 
gacatgttta tcaagaggaa aagtgacttc 
gcccgagtgt tcgctttgtt atggcaggtg 
acaaaaaggc aaggttccaa gtattcatat 
tgggggtgga ggatgtttgc atagttgaag 
acagaggcca tagaaaaagc taagactcag 
cccagtgact caaagcacta aaagtcagca 
atttgccatt cactgcagta gcaaaagtag 
agctccttaa atgaacattt gtgtttcatt 
gataaaactg aaatggaaaa ggtaactgac 
tttctgctga ttcaagacta ttctggctaa 
taggggatca gaaatcacac acggtaccgg 
tttgggtctg acttcctttt acatgcctgt 
ggagcttcac cacttcattg acggctttaa 
gaatccagca cactctcccc gggagcaaaa 
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ttgtaatgaa aggaaacagt ttgttgcttg 12C0 
gcaaggaagt agtaatgagt caccaagcc" 1260 
acttaactt* aattgaatcg aagagttatc 1320 
ttttgagatg gagtctcact czgzcaccaz 1360 
ctgcaacctc cqcczcccaq gttcaagcaa 14-^0 
gaccaaggtg cgcgccacca tgcccagrta 1500 
cactatgttg gccatgatgg tctcgatctc 1560 
ccaaagtgct ggaattacag gcaagagcce 1620 
acctcataag caaatgccac taaggaagga 1680 
gaccacagaa ctagtcctai ttaaataca- i™ 4 0 
aggttaatta tctcatagca taaggaaaat 1S00 
ttcctatagc atccaaccaa aagatctagc 1860 
agaaaggccc ccagaggtga accaattaga 1920 
agtgaacaga aaaaagtcag attgccttcc 19S0 
gtttcctcag aagataaaga atttagtaac 2040 
acattatttg aattctttaa aaagaaacac 2100 
gctttagctg gtatttttgc ctagaacgat 2160 
gaaacaatat ttctaatcca ggaagttttt 2220 
aagcaaaaga gggtagttac agattcacta 2230 
aattattcct ccttaaaata tattaatcac 2340 
tttttgcctt tattgtcaat aacgtcttct 2400 
tggagttaaa ggtctgaatt aagacaatcc 24 60 
tgagaaaagg caagaagtac ctaagaatct 2520 
taaagattca ccgtaagraa ctgaaaggcr 2530 
ttcacatgca aaggatattg tagaacatct 264 0 
ttgtgaggaa agaaaaagtr tcatgcaaat 2700 
agaaaccagt gacatttcrt gtaactgtac 2760 
aatatatgga agtgcaggaa ggtggtagga 2820 
tattctgtgt gagtgactcc atggcaccga 2880 
attgcagtcc gaggaaggct aactggaatc 2940 
cgcaccagcg aagagtacaa gagcgatgga 3000 
agtaaacaaa cttgaaaacc cctcttgata 3060 
tcttaacaaa acacaccgca aaagctctca 3120 
cccccttcac aatttacagg aagttactct 3180 
tgtgttaaag ggacagagtt cctttttatt 3240 
tatctgtaga ctagcatagt cggtacgtga 3300 
gagcacaaaa ctcctgctac gaacagtgcc 3360 
atcacactag gtattgactg attgtataag 3420 
tacctcctaa aaagagggga agagagaaaa 3480 
tagtttcagt aagagtgtac gttttaattt 3540 
cctgagtgca tctgttatcc agaagtagta 3600 
tctgcgttgc ctttaaggaa caacatactt 3660 
ctatggctct gtgtgtggtg ttttagccag 3720 
cctttgcatt gaaaggaaag tgcaagcctg 3780 
tcagtaatag actgtcaaat tcgggctgct 384 0 
aagttcacct ttgccccacc cagtgtttcc 3900 
gaacaagtgt tactttagga cttggagggr 3960 
ccttgggcgg gggtgtagga aacggcgagt 4 020 
tttgacgtcg tcagccggct tggtcttcta 4080 
taatcggaac tgaagtcagt agcatcgccc 414 0 
tactctgtgg tgggttaatc ggtttgaggc 4200 
tttctgttat tttcccgaac atgaaaagac 4260 
aaaagtgtgc cttacctgtt tccgccctga 4320 
actgattgga ttctttttct aactaggcag 4380 
ctgtgtttat tctgagaggt gctggggagc 4 440 
cttctctttt ggacagatct attccagagg 4500 
tgaagagaaa agcaactgga tgcgctatgt 4560 
cctggctgcg tgtcagaacg ggatgaacat 4 620 
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ctacttctac accattaagc ccatccctgc caaccaggaa cttctrgtgt ggtat-gtcg 4 680 
ggactt-gca gaaaggcttc actaccctta tcccggagag ctgacaatga tgaanc-cag 4740 
taagtggatt acagaacaaa aaaataaaaa atcccagtaa tgtcggttcc qcccczzzqa 4300 
actaataaca tgttgtttaa ttatacggct ttgtcatgtg tcggatgaag taggtggctc 4S60 
aagctaggga ctaggaagag gaaaaacatt ttttgagtcc ctattaacta ttaggaaac^ 4 920 
tgatcartta aaagtatata tatatatgag gagccacctt gagttccgaa ttcaggacgi 4930 
tacaggaaga aatatatgtc caattctaat tcatccaaaa gcagtcggga gaattaragg 5040 
gattgg-cca gacatgctgc gtatgcaagg tatagccctc atctgtggta ctttggcagg 510C 
gcttagaccg catcaaaata tttatagatg tacatttgag tgtacagtta ggatc.gatg 5160 
tggaacattg taagatcatt gctagaaaaa ctttgtcata acttttcaac attattctaa 5220 
gtgaataacc gtaaagattt tacatcttag cctccttcct tacagtaaaa aaacta-ctg 5230 
atctctcgat cagtattata gtagccacct atcactttat cttaacaaat Zczcaazzcc 5340 
ttaggt-tat gtgcttttac ttcttttacc tgattaaaat tgctgtcatg acctcrctct 5400 
gcagagggct gcatcatttt ggccattctc aagcgatctc tctgagcaat ttaagaattg 5460 
ccataagatt ctaacctctg ctgtaacta" ggttgtgtgt tcttggttag accacraaat 5520 
cttatcagca gttttaaaaa ttattccttt tggtttagaa gttaagacta aatgczgaag 5580 
tttttgtaac ttttggtttt gatatcat-t caaacttaag aaaacatttg aagaaaagga 5640 
caaagaattt ccacttaccc tttacccagg tttaccagtt attgataagt atatccattt 5*700 
gctttaccag aaggctaact tgttttagtt ctcattttca cctttgagac atttggaata 5760 
aatatcaatg ttaacataaa ttggaatttt gactttgatr ttaggaccaa tgaacaagcc 5820 
aagtac-tac cctagtcata tataatccaa ctgtatggtr atttggtatt cartccacac 5880 
ttcattttac ttgatctccc ttaagattgc aagattgtgt ttgcagtttt tc-gaaaacc 5940 
tggggctata aaagcatcag gacctccccc gtaggggagg tcgtgtgttt ggggtcctta 6000 
cacaacaggt tacccttgag cttcaggaaa agaactggct ctcagttccc cagttccagc 6060 
ttaatgggtc taattaggtc ctgaccaaaa aggtggcagt tcttttccct cacgtctctt 6120 
cagcgctccc cgagactctg gagactctgt catatcccta gggctgagcc tcccaggaac 6180 
cattcggctg ttgtggcatc tgtgtatgcc atgcccagtg ctgaggacct agtaacaaac 6240 
gacaaatgca caggcacagt ggcatttttg tggaactcgt attccagctg tgcgtctcag 6300 
aagaagcgca cagctccctc ctggctttct taacatagtg agccacttcc acttaagggt 6360 
ctccttacat tccttgagtt taatcattca tggattcaga ggaaagtctt ttgatttttg 6420 
cttttcttta aacagttcat ttgaggtgac ctaccccagt gactttgcac caaccaccaa 6480 
gaaacttttt tgcatgcttc ccgcaccctg tgccaatcaa gggaagggtt taaaggcctg 6540 
gcgtttttat tcctcaaaga aaggttttgc acagtatttt aaggttcaag tgcttctact 6600 
ttgtgttcag aagcaactgt catatatact gtgaaatgac accttttatt tatccctttt 6660 
tatttatgca gtatgtcccc ttttattttg gcagaatttt ttctaaatgg tggtttaaca 6720 
ttttcaagca catttcattg tccaatattc atagtaaaga atgagagtta acaataacca 6780 
g-tcacattaa aacaagattc ctgctgccag ttgtgaaacc ggttgtctta ggcgtggcag 6840 
ctgatgattg agactgtgat caggaaaatt tccactattt catcaggcct aataggcaga 6900 
ttgtgtctcc aaatgaactg tgttgggttt ccatgcttaa agcacaatag aggtggtgca 6960 
agaatctcca tgagggctta aatggcagtg atggttcagg cggtagagtt tggagaagaa 7020 
gggatttgaa acaaaccaaa ggaaagaaaa gtaagtagcc agaaatcaca aaatggcatt 7080 
tttctaaaaa caaaggaaaa ggaataaaag aactaataag tttgaaaccc ctaccccrcc 714 0 
caaatttggc agggggggag gtattttttt tctatctatc taactaaccc atctagaaaa 7200 
cagttgacca aattatagac ttctaaatgt taatctgctt tctcagtttc agttgaaaag 7260 
agactttgtt ttgcctactg cagaacttct aggttctttc ttatagtctt ggggttctta 7320 
ttatagatcg aaaatgtgag tcggcataat taagccattc ggagtcttca gaagcagttc 7380 
actcttgaaa tgactccgtc cgcctacagc catttaagat ttcagaacaa aaacagatct 7440 
tgattttctt tttcatgtta actcaagctg ttgctgagtg ggagagtcag aaatgacacc 7500 
agctccactg attactcagc tgctgaagga tgatttttta aaatgcacct ttactgtata 7560 
tggacttcct aatttccacc tgtagagcat cttagggagg ctaacatgtc actctggatg 7620 
ttcttttaga ataagatgca aatctatttt tctgaaggca ttagagatag caaacattta 7680 
ttgtgagttt actatatact aggcactgtg ctaagtgttt tgcatagaaa gtttaaaatt 7740 
ctggcttttt tgttggccca atcataagtt tcatatcagt tcaacattca aattatatta 7800 
aggtacttaa gaagaatccc tggctaaatg tgaggggcag tgccacagat ggactgaaac 7860 
tttatgctta ttgcacattt atgctattat tatttgttga attatagaac caagggagtg 7920 
tggaagccac tggaaaaaat atgagactta gatacataat ttgagtaaaa atggctcaaa 7980 
gtcatgaggg taaagttttt tgtatttcca ttttatrcga gcggcatcgt tttraaaaat 3040 
cattatgaat ttgaccctat atagatgttt ccaaataatt ctttttcacc ctcataaaat 3100 
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tccttcctgt 
tcctttacca 
cctcactgaa 
agaaatccct 
tagcgttctt 
gctggcagga 
gtcagcctag 
gacctatcag 
tagacgatga 
gaaggcatct 
ggcttgagtg 
tggtttccag 
ttcctgaagg 
ctagaactgt 
gtctttggga 
ttgaactggc 
ctccaggggc 
taggctgtct 
cagtttgaac 
ctgtgtatta 
tcctttaggt 
cccagtattt 
agagttttgc 
ctccacctcc 
ggtgtgcgcc 
ttggtcaggc 
gtgctgggat 
acagcaattt 
ttgttctgtc 
tgagtgagtg 
ttgtgtcgcc 
cttcagttct 
agagcagtct 
agagagagta 
acctctaccg 
gacgtgggag 
tgccagaaga 
ctcgctcccc 
aaagcctcaa 
ccggctctca 
gtttgggctc 
cgtacaacgc 
tgagcgctgt 
ctgtctacag 
ctctcccgag 
gggaggtgct 
tgaaggacaa 
cagaacatgt 
aagccatgaa 
cgctgaagaa 
gccagctctc 
atgcttgtgt 
gagcccccgg 
ttgactttgg 
gggtttggac 
gaaaaacacc 
cttaagatat 
cttgagagca 



ggctgtgaga 
ttttagcttt 
agaccgatat 
ctcccccagc 
ctctgtgttt 
gataacattc 
agaatacatt 
atagcaagtg 
aggatatttg 
ccacacattg 
actgtcctcc 
gcaaggctga 
catcatttat 
cctcattgct 
ataagtgctt 
tcaggaagta 
cagcactgct 
gcacatcgcg 
agggctttat 
cttgaaatga 
aaaccatgaa 
ttccactcca 
tcttgttgcc 
cagattcaag 
accacgccca 
tggtctcgaa 
tacaggcaag 
tctatcataa 
tgtgctgcca 
gcccagagcc 
agctgttact 
ctctagccct 
aaagcaaccg 
cagcgtgaaa 
ttctaacatt 
ccccgaaatg 
ctttttgaaa 
cattccatcc 
gagctccagc 
agagcaccgg 
ctaccctggc 
tcactacccc 
gagcagcatg 
caatctcctc 
ctcgctgccc 
tgtcccggcg 
ggcctgtagc 
ggtgcagccc 
tctcattaaa 
gcagaacggc 
caatctgaag 
ttgtatttag 
ttggggatag 
acaagtgact 
tagaagatta 
attctgaaaa 
ttgcatcaac 
gagctaacac 



tgccttgcct 
aaaaaacaaa 
tggcctgata 
aagctttcca 
attctggggc 
tctaaggggc 
taaagggttc 
tggagttctt 
cacaaaggct 
acagccaatg 
aataatcaga 
gcagggaatt 
tgtgtagcga 
gctgttccta 
cccccttagc 
cctattgtgg 
gggatcctgg 
aggaaggtgg 
caaattcgta 
gtcttaatcr 
catcagaaag 
ttaaaatgga 
cagtctggag 
cgattcttct 
gctaattttg 
cttccgacct 
agccactgca 
ggtctgtact 
ttgtccgcat 
ttctagaatg 
caggttttct 
ctgtgtaatc 
agcactgaga 
gaaatcctaa 
tcacccctca 
cccttctacc 
gcttccctgg 
tccaccactc 
cctcacagca 
gactcctacg 
tacgcacccc 
aagttcctct 
aatggcatca 
ggtgggggca 
tcagatggag 
ccccacagtg 
cccacaagcg 
aaagctacct 
aacaaaagaa 
aagatcaagt 
gtaggccttg 
cttgctttcc 
tgggtatgga 
tcccttctcc 
ggtgaaactc 
catgaagatt 
acttgagtct 
atgtggcttc 



atcagttttc 
agtgacaatt 
aggagatatc 
tcacggcccc 
ctcaggctcg 
tctcaaattg 
agttctggag 
tctcaactaa 
tcagcatgat 
ccttcagtgc 
gctcaaacta 
tccagttttc 
ggagacaggg 
aatagtatct 
ctgttctgtt 
tttggcagag 
ctagaccaga 
tattcacrtc 
ttcaacaaga 
ttcacattta 
acttttatta 
agtttttttt 
tgcaatggca 
gcctcagcct 
tatttttagt 
caggtgatcc 
tccagcttag 
aatgaaaaca 
tttgctgagg 
agagtgcgtt 
caagaaggag 
gccccttttt 
aaaatgaact 
aattggactc 
catcagaaaa 
ctcgggtcgt 
cctacgggat 
caagcccctc 
gccctgggaa 
cttacttgaa 
tgccccacct 
tgccccccta 
acaactttgg 
gcctgcccca 
cccggaggtt 
ccttctcctt 
ggtctcccac 
cagcagcgat 
acatgaccgg 
acgaatgcaa 
agagagagca 
atggggtatc 
ttccgcctgg 
tgattttctt 
cctgctagcc 
tcttctrttt 
tggagcagaa 
ttcccaggtc 



aagct tact t 
agaacttcct: 
tatttngtm 
cccgtcagca 
cccaggacga 
gaatcgaatc 
tttcacagag 
attcaagcag 
cccccaaacc 
gttcctaggg 
aacatcgtat 
cctgcccaga 
ctggctgtgg 
ttaccaagta 
ttcttgggtg 
gtgacugtca 
cagagcctzg 
gctaagctcc 
gtagaagcga 
gttctcaggg 
acctatgaca 
ttttttttct 
caatctcggc 
cccaagtagc 
agagatgggg 
gcccacctcg 
gctatcttac 
gaatcaccca 
aggaaacgga 
ggaagccaga 
gagcaacttt 
ctttatttca 
ctgcccaaag 
caacccctcc 
ggacctcgat 
ttaccccatc 
cgagagaccc 
tgcaagaagc 
tacggtgtcc 
cgcgtcctac 
cccgccagct 
cggcatgaat 
cctcttcccg 
ccccatgctc 
gctccagccg 
taccggggcc 
ggcgggaaca 
ggcagccccc 
ctacaagacc 
cgtttgcgcc 
gtccaagggg 
gattgcattt 
cttttgccac 
ctgaataata 
tgtgattttt 
aagactgtct 
atgttaggtc 
cacctgagag 



gtctttctca 
gcctgctggg 
tagtgnct^c 
tcrtccctga 
aczgataacc 
cctcaagcca 
ttcat — cua 
agacatttr- 
tgctgcctc. 
caggtgtccz 
gtcttactt- 
tgggtgrttz 
cagggatag- 
ataacgtgcc 
cgctaagtaa 
cgccttgtga 
gtgaag-gc" 
ttggcatagg 
aaattgacga 
tatgctgatt 
gggtccccac 
tttttgagac 
tcaccacaac 
tgggattaca 
tttctccatg 
gcctcccaaa 
tccagcctaa 
aggctgctgt 
actgcacttr 
tatgtggcga 
ggcagttttg 
gcacaaacac 
aatgtcccaa 
aaaggaaagg 
gactttagaa 
cgggcccctc 
acgtacatca 
agccccgacc 
cctgtgggcc 
ggcacggaag 
ttcatcccct 
tgtaatggcc 
aggctgtgcc 
aaccccactt 
gagcatccca 
gccgccagca 
gccgccacgg 
agcagcgacg 
cttccctacc 
aagactttcg 
ctgtgagtgc 
gcagtagtat 
ttctagctct 
aaaaaattag 
gtgcttttaa 
tgatgctttt 
tcagagccag 
tgcacagtgg 



8160 
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3700 
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10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 

10680 

10740 

10800 

10860 

10920 

10980 

11040 

11100 

11160 

11220 

11280 

11340 

11400 

11460 

11520 

11580 



WO 99/67395 



PCT/FR99/01513' 



58 



agaacggcct 
gaaacactac 
ctgggtagac 
tagcccgtag 
atggtccttc 
tgggtgggaa 
ccgtttgctt 
gggcgttggc 
tctcccttcc 
caccagcaat 
ggtgtgccct 
ccgggagcgg 
caaggttcac 
tctgacccga 
cgaggacgtg 
ggtcagaaaa 
tggactcctc 
gcctcccagc 
aatggatcct 
gtcagggtgc 
agcaaacggt 
cagggcatga 
tatatactta 
ggacatgttt 
aatgataatc 
gtttacaatg 
ccattctttg 
tatatgactt 
gccaatgttg 
cataacttgg 
aagggaatct 
ggaagggtga 
caccgccctg 
atccattgta 
gaaaatttcc 
gtggtgtttt 
tgcacaaaca 
aaaaacaaac 
taatgaacaf 
ctcagtattt 
aagttgttca 
atctaatgat 
ttgtgttatt 
tagcaaaaaa 
tttataacca 
aaaaaaaaaa 
tcacaatcac 
gtgcagtggt 
aaggaccatc 
caagtcacag 
aaatactgat 
actaatgttc 
tactggtctt 
cagtccttaa 
tcccaactac 
aaagacttct 
ttgagcccac 



ttcaaatgtc 
ctggtacaca 
cttctgacct 
ttaaagccaa 
ccagtacttt 
aatggtaggg 
aataccacac 
cggtaagcct 
ctgctgtctc 
ctcaagaccc 
gccaagttca 
ccccacaagt 
ctgaaaggga 
atcaatgaag 
gaggatgaca 
gagaaagaag 
ccctcagggt 
aacccactac 
taagattttc 
ctgtaggaag 
ttcccctcac 
acaaggcaaa 
tttacacctg 
gcatagcctt 
cttcataatt 
actggaaaga 
tagataattt 
cagtcaacct 
gacagttgat 
gggtatgtgt 
tgtatatttt 
caggaaggct 
ccctccccac 
ttatcagaaa 
ccaaagcata 
gttgttggtt 
tggtgctcta 
acacaaacaa 
tcctatcccc 
gtgtttttac 
acaacagtta 
ttgcttctct 
ctatctttta 
tgatgtatat 
cttaaattgt 
aaaaaaaaaa 
gtcggtatga 
ggggaccaca 
taagacagct 
aaataaaaaa 
acattactcc 
acctgtagaa 
ctgtaacttc 
ctgaaggtaa 
tcgtttgttc 
tgcttctctc 
aatcaacagt 



agacttgcaa 
cgggagaaaa 
ttgtagaaaa 
caccagattc 
gtatctgctg 
gaaataaaca 
tggaggtgcc 
gcccctcccg 
cctcccctac 
acctgcgact 
cccagtttgt 
gctcccagtg 
actgcgctgc 
aaatcgagaa 
tcagtgtgat 
aaactggcct 
gcagccttta 
ctctggtacc 
agaaaacact 
tggcttgtac 
ctctggaatc 
ggccatatat 
tgtctatata 
cccattacta 
tattatacaa 
ttccttgtaa 
ctgcacatct 
ctctctctaa 
gtgttcattc 
gcaggattac 
tgttgatagt 
ttaccaacct 
cgagtcctgt 
atgtgaagaa 
ggtggctttg 
tttgttgctt 
ccaggaagga 
caaaaaacgg 
aacacatcaa 
attttatggt 
cctcattgag 
agaggagaaa 
ttctgctaag 
ttataaatct 
gagccaagcc 
gaacactcct 
ttgggcaccc 
aaacaaccag 
ctattttttt 
ctgactttac 
aatctatttt 
gagaacaaat 
caagactgac 
accaaagcat 
tttttctcct 
accatccatc 
ggttttattt 



caagggcttt 

gccacatgaa 

zzzczqtqaq 

^.gcgctgtcc 

acgacttgag 

gcccctcgtg 

acaaggaggc 

ttggcaactc 

actgtaggtc 

ccattctgga 

gcacctgaaa 

ccacaagaac 

ggccccggcg 

gtttgacatc 

ctctgtagtg 

gaaagtgtct 

tgagtcatca 

tgtaaaggtc 

tattttgttt 

ataatcccag 

aaagaaggaa 

atatatatat 

tttgcccctg 

agactattac 

tttatcattc 

tttgagtata- 

gtataagtac 

taatggtttg 

ctgggatcct 

ccaagaataa 

tcatgttttt 

gtctctccct 

ggccattcag 

gaaaaaaatg 

tgtgtgtgcg 

tttttttttt 

ttcgaggtag 

gtattctagt 

ttgtattttt 

taatttaatg 

tgtgtccagt 

ccgagtaaat 

cccaaagatt 

atttatacca 

atgtaaaaga 

ttctgagact 

ttgcctactg 

ggaggaagag 

tttgccactt 

cgctgcaatt 

ataattatat 

ttcgaataat 

agctttttat 

cacgttgaca 

tttgtgcttt 

cttctctttt 

tttcctctac 



actcagctcg 
tgccaggtgc 
tcaccccccc 
carcctggac 
atggcacagc 
tgctgtgtgc 
ttcccacctc 
ttaatcttct 
tgccacaaga 
gagaaaccat 
ctgcacaagc 
cacatccatc 
cctgggctgc 
agtgacaatg 
gagaaggaaa 
ttgcaaagaa 
gatctacccc 
aaacaagaaa 
cttaagttat 
ctctgcaaag 
ctccaaagtt 
atatatctgt 
tgtattttga 
ctagtcataa 
agaaagcaat 
aatgtatttt 
ctaagattta 
aaaatgaggt 
atcatttgaa 
cttaagtaga 
cccccagcca 
ccaaaagagc 
agcggccaca 
ccatgtttta 
atttgggggc 
ttttttttta 
ataggctcag 
catcttgggg 
tctgtaaaac 
gaagatgaaa 
agtgcaggaa 
gtgctccagc 
acatgttggt 
ctatatcata 
tctacttttt 
ttgcttaata 
taagagaccc 
atacatcatt 
tatgattatg 
tttctgtttt 
ttgacatttt 
ccagggaaac 
gtatcagtgt 
ttagaccaaa 
cccatagtga 
ctgcctctta 
tcaaagttaa 



cccacc-gca 
gcagt az 1 1 z 
azqzczzaza 
tgatcgcacc 
cagctuccag 
ccaca:cccc 
ctaggt tgct 
ggccttcctg 
gatttagcag 
accaatgcaa 
qtctccacac 
tctgtagcct 
ccttggaaga 
ctgaccggct 
ttctggccct 
acatggg.gaa 
tcatgaagr- 
cagttgaacc 
gacttggtga 
ctctctcgac 
actgaaatct 
ataca^atra 
atatttgtgt 
ttatttttte 
aattaaaaaa 
tgccttgtgg 
gttaaacaaa 
ttgggtaatt 
cagcattgta 
agaaacaaga 
caattttacc 
agaatcctcc 
tgacttttgc 
aaaccactgc 
ttgagtctgg 
atgtcaaaat 
gccacactrt 
taaaagcggg 
tcagattt^c 
gggcattgca 
atgatgtctt 
aagatagact 
gttcaaagtg 
tgtatatata 
ctaagggcaa 
cctggtgacc 
taaaaccttg 
ttttagtatt 
tggtcacacc 
cctccttact 
gttcacatca 
ccaagagcct 
ttgataaaca 
tacttttgat 
gaatttttat. 
catgtgaatg 
aactgaccaa 
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<210> 66 
<211> 46340 
<212> ADN 

<213> Homo sapiens 



<400> 66 

tattttactt 

tcaggatcaa 

ccatctgcag 

ttgaaaaagg 

tatatcataa 

caacatcaca 

taatcctgag 

ggacccttca 

gcattttttc 

gctgaatact 

ggataaatgg 

cttaggtaca 

agaagtgcca 

ctctgccacc 

caggttcaag 

accatgtcca 

gctggtctca 

gttacaggcg 

gagacagaga 

aaaataaaaa 

tcattatttc 

atctgacaaa 

tactcttaaa 

cagagtacag 

ctatgatctt 

tttgttgtgg 

gagaataaaa 

taaattttaa 

atacatacat 

ttgaattgca 

gggactacag 

tctcactatg 

cattagcgac 

acacaactgt 

attctcagca 

gggagctgaa 

tcggggagta 

ggctgatggg 

tctgcacatg 

gtagaaaaaa 

cactgaatac 

gtatgaaaat 

cttcactatt 

gttttggctc 

gagggactgt 

cctcatgttg 

gcagtttttc 

tttctgccat 

ttaaaccttt 

acagactaat 

aacaatatca 



cagtaacaga 
tagcagaagg 
ccacaggacg 
aaaaaatgat 
actttatgtt 
gatgtggtat 
gaaacagaca 
aaaacttaaa 
tcagtatctc 
aaattgaaga 
ggaaatacag 
ataaggacaa 
tgatatccaa 
ccggctggag 
tgattctcat 
gctaactttt 
aactcctgag 
tgagccaacc 
gagagagaaa 
aatattaact 
aacttttcga 
aactgttagc 
attgtttcat 
aggctctgaa 
gtacccagtt 
aaataaatga 
gcatttttac 
gctttctgag 
attttttgtt 
gtggtgcaac 
gtgtgagcca 
ttgcccaggc 
aaggttttgt 
tagagatttg 
aactaacaca 
caacgagaac 
gggggctagg 
tgcagcaaac 
tattccagaa 
taaacatgta 
atagtatttt 
tgtaattttt 
tgaactcttt 
tgtgtttcca 
aatccccatg 
ttctcgtgat 
ctgcactctc 
gattttaagt 
tgcctttata 
acattcttca 
tgcataatca 



aaatgaaaga 
acaaacttct 
aaacagcttc 
tcaagcaatt 
ggcattaggt 
cactgtgaaa 
aatccaaagt 
gacattaaaa 
ttaaagagac 
aggacatttx 
aatggacaac 
tccttatttt 
aacttaatct 
tgcagtggcg 
ggctcagcct 
tgtattttta 
ctcaggcaat 
gctcctggcc 
gagagagaca 
aatggtgatt 
taggtttcac 
agcactacat 
ttactaaatt 
atgagccagt 
tcctttatct 
gcaactttgc 
ctcctctctc 
atgaaaaatc 
tgcttgtttc 
ccccaagrtg 
ccatgctcag 
tgcctcatat 
ttttgtcttt 
gtttaaaaag 
ggaacagaaa 
acatggacac 
ggagggatag 
caccatggca 
cttaaagtat 
agcatgtgag 
aaaatagtaa 
aaaaaatctt 
agggattatt 
tccaaatctc 
tgtcgaggga 
actgagtgaa 
atctctcttt 
ttcctgaggc 
aattatccag 
atttaaaaag 
agtgattaac 



aatgttttaa 
ttgaggagat 
tgaatgaaag 
aagtctttgt 
cccttttgat 
aatgtttaac 
tgggtgggac 
agcaaacaac 
taacaaagca 
ttagaaatcc 
tgataatatt 
taagaaattc 
tctrtctctt 
cgarctcagc 
cccaagtagc 
ctagagatgg 
ctgccggctt 
ccaaaactta 
gagaatgtgt 
ctaggtagag 
aatttccaaa 
cgtaatttat 
tccttagtga 
gtctatgaag 
gttaatttgg 
caaccacaga 
cctcttaacg 
attaaaactt 
ctgagacaag 
caatcctcca 
ctaatttttt 
tttataagaa 
taatgacaga 
aaatagacat 
accaaacacc 
aggcagggga 
cattaggaga 
catgcatatc 
aatacaaaat 
ctgcctttcc 
tccaataata 
gataatatgc 
tttaaaaata 
atctcaaatt 
gggaggtgat 
ttctcatgag 
cctgctggct 
ccccacaagc 
tctcagatat 
ccatactttc 
tgtgtaaaga 



tgttgctgat 
cccctagtgt 
gtcttrcagt 
tgctgccaat 
acggtgttag 
atgataaatt 
attctaaaga 
acaaaaagat 
aatacaaaac 
aactatgaaa 
attgagttaa 
attgttcaag 
tttttggaga 
tcactgcaac 
tgggactaca 
ggtttcacca 
cggcctccca 
accatctaat 
gtgtgtgtga 
ggtgtatgat 
acagcagatc 
tgctaataat 
tgatggaggc 
agcaccactg 
gacattccat 
gtaaataaat 
gttatttcac 
aacaagaaca 
gtttcactct 
cctaagcctc 
racttttttg 
tatgacttca 
ggtatacctc 
ggatgaagct 
tcatgttctc 
acatcacaca 
aatacctaac 
tatgtaacaa 
gaaaaaataa 
taattctatg 
tatttgagtg 
attgaatatg 
tgattgatat 
gtaatcccca 
tgggtcatag 
atctgatggt 
tgtgaaggtg 
catacggaac 
ttctttaaag 
tcatacaagt 
taataaggtt 



tgtattacct 
gtgcaactgt 
cgttgtctat 
tacaaattta 
cacaattaca 
caggtaaatc 
taattggctg 
atcaacaaaa 
ataaaccatg 
cacagttttg 
tgtcaaattt 
tgtttaggaa 
cagagtctcg 
ctctactttc 
ggagtgcgcc 
tgttgcccag 
gagtgttagg 
ggttgagaga 
agacaaagca 
tttagtagtt 
cagccatttc 
ctcattgttr 
tttatcatga 
tttgcaagat 
atctcttgag 
aaatgttaaa 
tttaagacgg 
gagaaatgcc 
gtcacccagg 
cagagtagct 
tagaaggggg 
aacacttagg 
aacatatttg 
ggaaactatc 
actcacaact 
ccaaggcctg 
gtagatgagg 
acctgcacat 
ataaaaataa 
tttatgtatt 
tttgtgacaa 
atttaattca 
cctttgacat 
cccgtctagg 
gggtggtttt 
tttaaaagtg 
cctgcttccc 
tgtgagtcaa 
cagagtgaaa 
tgaaaccaag 
gaggagttca 
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gagaagaaaa gaaatgaata gggaactgta 
agggtttttg atcttcaggc catgaagaag 
gttggtgaaa ggctttttcc gacgactaat 
tatgaaccaa aaccagaatg actggtgaga 
gacaactgga gctggtgcag tggaaaagga 
aaaaaagtca gaaggtacct cccgcagtcc 
tttcaagaat ttggagctct cattcatatc 
t'gctataatg aaattacctg gaatatttct 
gtgaatatcc tcatttgatc attacacatt 
ccataaataa ttgcaactat tatgtatcca 
cctgaaaaaa aatgctaaac aggaaaggcc 
aaattcttct ctaacctcac tattggagaa 
tcaccctttc ccaaatctga gcaagtatta 
atgaggtatt tgcttactgg ggacaaagcc 
tgtagaatgg taaaaacaag aaaatgctca 
cttattttaa aacacaaaaa ctcaatatac 
tttaatattt attatacagt acctttaaaa 
gtgctagcaa atagcaatta agtacctaag 
tggggagtta gttacttcta tcatctgaat 
ttcctcatca tggcagtatt aagaggtgaa 
agagtcctca agaatgggat caatgctctt 
ttttgcccct tctgccatgt tgggggggtg 
ctgaagcaga gagcagccct caccagaaac 
cccagcctcc agaactgtga gaaataattt 
tgggcgtggt ggatcacctg aggtcaggag 
ccccatctct actaaaaata cagaaaatta 
cagctactca ggaggctgag gcaggagaat 
gaatcaagat catgccattg aactccagcc 
aaaaaaaaaa aagtacacac tctaacatat 
aagacaatta cccttaaaat aaaagctccc 
ttcttaaggg caatgggaat ggaggacata 
gcccgatgtt agagctctgc aaagaagact 
cacaaatagg aatgctgtaa acgttgattt 
tatccaatgc aatctaaatc ttaggttgac 
accacaatac ctgatcttgc cacatatttg 
agaaacagta ttactctcat gagaaataac 
gttacttttt caaatgtatg ttagtcattt 
tggtaatggc tggctgctcc catctctcct 
cattttttct tatatgggaa atttacagtg 
agcagaaaaa cgaaacttat aaacatttta 
aagtgtaaaa cttagaattc ttataaataa 
ctcatgcctg taatcccagc acttcaggag 
agtttgagac tcacccgggc aacacagaga 
agaaagaaat gaaatgcaaa gaaaaagtct 
ggttaaccaa tattaacatt aacgttgata 
aaaatcagac aatgtatgga ctttaagagt 
ggtttgagtc ctatgagtta tatacagtta 
ttaaagagta ttagattcgg ctgggggtgg 
gaggccgagg agggaggatc acgaggtcgg 
aaacctgatc tctactaaaa atacaaaaac 
cccagctact cgggaggctg aggcaggaga 
gtgagccgaa atcgcgccac tgcactctag 
aaaagagtat tagattcaag tcctgtttct 
acctatcttt cctgaacctc agttttttca 
atatatacat ctgtgtaaac acatatgtgt 
atgtataaat ggagataata cctacattat 
attctgacac ataacaattt gtaacttaaa 
aacactgtaa tgcatagtct aatttaatac 



60 

gtgacaattt aaaatagcca tccctcaccc 3120 
cttttaatcc tttttagcaa aggaagtaat 3130 
ggaaagcagc gctatgtatg gtgacttcq- 32*0 
ggctgactga atacagcaag cttatgtgaa 3300 
agacagcagg actgtaccca caactcaaag 3360 
aacctgaaaa caacaaag-c aaaggaatcr 3420 
ctaattagtg tatgaaatgt gaggtggctt 3480 
aacacaaaga aataataaat gcttgaggcg 3540 
gcatgcttat agcaaaaga- tacatgtacc 3600 
taataattaa aactaaaaga ttaaaaacta 3660 
aactagtctt gcttacaca- taaaaaacag 3720 
atatcctgtt atttctatac atcttttttt 3780 
taaaggtata accttcaaca atcttttacg 3840 
ccagtgctat tacatagtct agctaaacgc 3900 
gcaaagtgtt gtttctcacc taatgaaaat 3960 
cccaaccaaa aatctgatga acattttctg 4020 
acgtaatatt cttattctta aaaatttagt 4080 
tcaatcagga cgacaaaaaa atactcaatt 4140 
gcgtccctcc aaaattcatg ctgaaaccta 4200 
gcctttgaga ggraattagg tcatgagggc 4260 
ataaaagagg ccccagggag cttgtaaggc 4320 
ggggtggggg cgcagcaacc agtgctaact 4 380 
cgaatctgtt gaagccttga tctctgactt 4440 
tctgttgttt ataaattacc cagtctaggc 4500 
ttcaagacca gcctggccaa tatggtgaaa 4560 
gctgggcata gttgtgggcg cctgtaatcc 4620 
cacttgaacc cagaaggcag aggttgcagr 4 680 
tgggcaacaa gagggaaact gtctcaaaaa 4740 
tttggtatag cagcccaaat ggaatggact 4800 
atagagagat catgcattca agtacagagg 48 60 
ttcctgcaaa cttttcaaca gctctcatta 4920 
aaattatact gagaaatatt tttaaatctc 4980 
agtatatata aaattagaca agactaacaa 5040 
agacaagaaa gccactgcaa acaggaatat 5100 
taaatatgca aagtatttca ataacttcca 5160 
atgatgtaag tcacctttga aactgtcctt 5220 
cttaacacca aatgaaatga aaaactgagg 5280 
ctactcatgc gccttcacca atacagcaar 5340 
ttgatatagc tcagagatat attgaagaaa 5400 
ggaaacctta tgtattttct taaatagttc 54 60 
tgtgtgttac agctatattg taaatggtgg 5520 
accgaggtgg gaggagagct tgagcccatg 5580 
gacctcatct cttaaaaaaa aaagaaagaa 5640 
ctatttcaaa tgtagccagt agagccaata 5700 
aaacaagaaa tgatgattta ctataagctg 57 60 
aacaggcacg atcatcacaa acttaaatca 5820 
catgatgcaa caaaagatgc cagccagttg 5880 
tggctcatgc ctgtaattcc agcactttgg 5940 
gagtccgaga ccagcctggc caatatagtg 6000 
tagtcaggca tggtggcacg tgcctgtaat 6060 
attgcttgaa cccagggggc ggaggttgca 6120 
cctgggcaac agagcaagac tctgtctcaa 6180 
gtcatttatt atggaaccat ggacacaact 6240 
actgcaaaac aggaatatat acatatgtgt 6300 
atatatacat ctgtgtaaac acatatgtat 6360 
agtttctgag ataataaaat gcacaacaca 6420 
acataccatc accagggcca ctagrtttag 6480 
tatgcaaact gtgttcactc aaggttttat 6540 
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ttcctttcaa tttcattcat ttactcttca 
tgaaattcag aagcttacgt tttaatgttt 
aagtcatttt aacactactt tcaaaatcag 
taaaagggaa tactaataaa tagacttaat 
cttttgttct gcaaaagatc ctgtgaagag 
aatatttgca aaccatattt ccgagaaagg 
aaattcaaca gtttttaaaa aaagcaaata 
acagacattt taccaaagag aatatatagg 
cacatcatta gccattaaag aaatgcaaat 
taccaaaata tccaaaataa aaattagtgg 
aatagtcctt cacacactga tggtacaaat 
tatggcagtt tcttacaaaa ctaaacatgc 
tgaatattcc cagaagtaaa aatgtcttct 
tgttttattc gtgagagtca aaaacagaaa 
gaatgcttat aaactgactg taataggtct 
ggaacaaact actggtatat gcaacaactt 
aaaaaagtca atctcaaaag gttacacact 
atgacaaaaa ttttagaaat ggaaaacaaa 
gcagtaaggt aggtggctgt ggctataaaa 
gggtatattt tgaatatagg gtgaatttac 
acacacacac agtatatgta aaactaagga 
tacaatttcc tggttgtgat actgtactgt 
ctagatgaag ggtatgtaga tctttctgta 
attatctcaa aataaaaatt tttttcaaaa 
atcaaagttt tctctgagga cctgtagcat 
tagattctca ggctgcatat tggaattcct 
caagtgattc atgtttaaag tttgagaagc 
caacctactc taacacactt gaaggccata 
ttggacagtg actctcaaca caaatgagtg 
caggaaaagc cccttaggtg atcctgatga 
agaacagtca attaaggctc aaaacaaaag 
ggcagataat atatactata acagagcaaa 
gaaccaaaat cagaattaaa atcactaagc 
aatgaatgta gtctaagtaa atactaataa 
cttttactct tcatacttcc tagtcacaaa 
tcaaataatt tatggcctgg tacagtaata 
cacatattct agctctggat ggcacttgat 
cagctctgtc aattagtacc tatatgaccc 
ttgtgtgtca attgtatcat ctataaaatg 
tttttgtgaa ggttatacaa ttaattcata 
gaattctcaa tgagtgttat aattgttctt 
ctactgaatt ctaatatgta ttctgtattg 
catatactat tcttgtagtc aaccctgtta 
tttggtcata catattgttt tacatacatt 
aatgaccatt tatggctaga agggtatata 
ataaagagga ggaagaatgc catcagagta 
ataaaaagct atgaaagaga aaaacataaa 
ccagtagatg cacaatgcac tgggttgtaa 
cacggatgga ggtgctgggg gagtctccta 
aaggggctca agtttattta aaaagagatt 
taatcccagc actttgggag gctgaggcgg 
gcctggccaa catggcgaaa cctcatctct 
gtggcgtgca tctgtagtcc cagctactca 
tgggaggcaa aggttgcagt gagctgagat 
agtgagactg ctcaggatct cccaaagacc 
atttgctcca gtgaggctta gatggacatt 
atattatatt gataatttat gtatgttgta 
catcagctac tttgtgtgtg tgctttgttt 



grtgtttcta agctaaaaac tccagaatea 6c00 
t-ctatatgg caaggaaaaa aaaaagggcs 6660 
cctagaactt aacactaaag gcatcaec-a 6~20 
taaaattaaa caacaacaac aacagczaaz 6~ 50 
aatgaaaaca taagccgcag gctgggagaa 6840 
tcttgtgtct ataatatata acaaczccza 6300 
acccaattag aaaatgggca aaagacatga 6560 
tggcaaataa gcatatgaaa acatatctca "7020 
taaaaccaca atgtgatatc attacacacr 7080 
taacaccaaa tgctggtgcg catgtggaaa "140 
gcaaaacagt acagtccctc aggaaaggag 7200 
acttaccata tgaccaagca a-rtatactci 7260 
ccaaaaaact tatacatgaa cgt tea cage 7320 
gcaatcccag ggctacccat caaaacagg* 7380 
gtcccacgga atactactca gcaataaaaa 7440 
ggatagatct caagggagtt atgttatgtc 7500 
gcatgactcc actgatataa cattagugaa 7560 
ttagtagttg tcagaggtta gggaagaaac 7620 
gggtagecta agagatcctt ctgttgaaac 7 630 
atatgtgata aagattgeat agaactaaa- 7740 
aatctgagta aggtttgtgg attatattaa 7300 
aattatgcaa gatgttagaa ttgggggaaa 7360 
ttatttctta caattgeacg tgaatctgta 7920 
tttcaaaaca actagtctag agcrttgtta 7980 
tttggttatc acctggatct tattaaaatg 8040 
gaattggaat cegcatttta acaagarttc 8100 
actagtctac aacaatgact tttaaccttt 8160 
acaaaattca catcaataac agttgcccgg 8220 
aggaaaggtg gggactcaag actcaggtag 8230 
aatgttttct ccatcctggc tgaaaaaccc 8340 
taatgtttat aatactggag atcttcaaaa 8400 
ggtaattatt acaatgtata aatcttataa 8460 
acataatgaa aatcctttaa aaagtaraaa 8520 
tggcagttat agtgagaaaa gctctagagr 8580 
catctatttc caaaactgac ecttegtatt 8640 
agagcatgac atttaaagee agtcagaaga 8700 
gacgatggat tcagcttatg gttccaatcc 8760 
tagtcaaata cttaaacctt cttgtgttac 8820 
aggatattaa cagtatatac ctcatagatt 8880 
taaagtattt agaacaatgt ctagcacagc 8940 
tttaaatgtg acttgactct caacagaact 9000 
agctgtcaaa aaaaataagg attataataa 9060 
ctatgttatt actagtgtca gttttgttgc 9120 
aagaattatt agaaatgttg gtttattaaa 9180 
tctggctcac tgactgtgga gtcaatgtcc 9240 
aaaggagatt ctattcactg aaacaaagtg 9300 
ataaccaaag gggtgaaact taacagatgc 9360 
aacttaaaat ggecttaatt aaaagccaag 9420 
cggacacagc aggcagaatg taacaatgac 9480 
ggacaggccg ggcgtggtgg ctcacgcctg 9540 
gtggatcatg aggtegggag ttcgaggeca 9600 
actaaaaata aaaaaaatta geegggagtg 9660 
ggaggctgag gcaggagaat cacttgaacc 9720 
catgtcactg cactccagcc tgggcaacag 9780 
caaatccctg taaactgaat gcataatatc 9840 
ctagtcttct tggttgagct gaagaaacaa 9900 
tttttcaagg tatagcaaca agtttttart 9960 
ttaagtcttt tgaaacagga tggtgactta 1C02C 
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ctacatttat 
tcacttgtta 
gcaaagttca 
tactatgtgt 
gtgaaaaaga 
gaactgaaaa 
actaactatg 
tggatggctg 
gcggatcacc 
aacaaaaata 
gaggctgagg 
gtcccactgc 
caaaacaaaa 
cacttgacac 
ataaatatta 
ttcttataga 
gagaatcaag 
aattacaaca 
acctatgttt 
ctggatagaa 
ggcaggaata 
ggtatcacta 
tatgtgataa 
attttaactc 
ttcattttct 
gtagaaagta 
aatatagaag 
agataaagtc 
agtggataag 
tgtagtggaa 
tagagcaaat 
ttatctttga 
gtgcttaaca 
aagaaaggta 
gtattctaac 
aagaaaaaga 
atgatatctg 
attttacatc 
atatacaata 
tttacagtaa 
agtctgtagc 
ataagcactt 
actaaaaaat 
ctccaaagga 
tatccacaat 
attctgtcta 
caaataagcg 
gagaagtaat 
ttacagaaca 
aaaagaagct 
tctaaaattt 
cattatatat 
actaatacaa 
ctgcatatga 
ttaattagta 
gtgctgacct 
gaaaagtgat 
cctcacccct 



aagtaaaact 
tatttgcagg 
tttatcgatt 
tatttaagaa 
ctgctctcat 
ggcattttag 
agtgtgcttg 
ggtgcagagg 
tgaggtcagg 
caaaaattag 
caggagaatc 
actccagcct 
ctcaaaaaac 
acaattttga 
gtgaagcttc 
tctttagcaa 
tagctgctag 
aagaatattg 
aacaaaagca 
ttatcttaat 
aattttatca 
tgctaatgga 
cagaaatatg 
tggacttact 
aagagttgga 
aaatattaca 
gtcttcaagc 
atttgagtat 
gagagaaaag 
ataacaaagg 
tacatcaacc 
acaattgatg 
atgactagtt 
acagtattta 
ttcagtttcc 
aaacaggggt 
cttcaactgt 
acatggtttt 
cctcattaaa 
acagtctttt 
acttatcaga 
tctgtactta 
aataattaac 
gaagtttctt 
ctggtttgga 
gacagtgcca 
caacactttg 
acttcccttt 
aatggtattg 
tcatataaaa 
tctcccaaaa 
aatagcttta 
aaagaatgta 
acatgtttta 
taaacaaaga 
caaaagtgaa 
tctaaacctg 
caaggaatgg 



-att-ga^tt 
tgcttaaaaa 
aatcaagaat 
ttaaatctag 
ttttgtacaa 
aaaaactaga 
ttcatgccca 
ctcatgcctg 
agttcgagat 
ccgggcgctg 
actcgatcct 
gggcgagagc 
cctattggca 
gataatgaac 
attgctgaaa 
aaacaaaaaa 
ttgagtaata 
tttttatttc 
taggtacaac 
agtagtaccc 
gaaatcttca 
tacaaagaca 
tacaaagcac 
ggcatttaga 
agctacatca 
acagtagaga 
ttccagcttg 
tcagagggca 
tggactaaag 
tttggttgga 
tttgggagta 
tgataattaa 
cttttcattc 
gttgttacag 
tttgaagtct 
ttacacagga 
cccatgcata 
caaaagaaga 
taaaaagaac 
ggtggtagaa 
ctacttttat 
tgttgagagt 
atttgaaaag 
aattgatact 
gtttatgttt 
aatgtacttt 
tttcctcttc 
cttgggatcg 
cttttaaatt 
gtgctaggat 
gatctgaaaa 
aaatatcttt 
attaataaac 
tccttttggt 
aatcaaaata 
attctgttct 
ggctaggagc 
tctatgggtt 



acaagggttg 
atcagctata 
ataattagat 
aaaagggatg 
caattactaa 
tttcacaatt 
aaagctacct 
taattccagc 
cagcctggcc 
tggcgggtgc 
gtgaggcgga 
ccagagcgag 
attactaggg 
cgaacttacr 
tggtgacaaa 
accccaagca 
gtggtaatag 
ctgtccatgt 
aacgactacc 
aagtgcagga 
ttcattacat 
aataacatgc 
tatgaaaaaa 
gcaaaaccaa 
gtaggtacaa 
atttcaaaag 
aaacacatat 
gaccgaatat 
gccatagcat 
atcccaactc 
ctgtttctga 
atgagatata 
ctctcttgaa 
aacccattaa 
tgttaatgag 
tatgctgcca 
tttggcttaa 
ttcattaaaa 
agaccatttc 
agagggggaa 
cctttatgta 
ctgaagccca 
ctgtcattat 
atgattaaat 
tgtcttattt 
gtcatacaaa 
gtatcctttg 
agatcaattt 
tttatatgaa 
tgatattctt 
atcataccaa 
gctaattcta 
tattttcctc 
gtacttacat 
gcaagaagaa 
cttgatgccc 
tagtggagct 
ctgtggtgaa 



cttaagtgta 
ctaaactata 
ttgcctaacc 
gactctggaa 
atttctaagu 
tataactcca 
tccaaaatta 
actttgggac 
aatatggtga 
ttgtaatccc 
ggttgcagtg 
actccgtata 
ccatcaaatc 
acttttgaaa 
gatgaatagc 
tactatggta 
gcaccacaac 
tttaaaaaag 
actactaaca 
tctctaagta 
atttactatg 
aaacaactgt 
attacaaagc 
aacaatccta 
agtaaaatat 
aagataaaaa 
tttttttraa 
aatggtactt 
atagagcttg 
ccaacaacgt 
atctgaaaaa 
tgaaatatct 
ccattgtgaa 
gagagaataa 
aataaatatt 
gactttacca 
gatatattca 
tcagcttaag 
caaatgaatg 
cagagagggg 
gagaaatagg 
cctttaatag 
tatagtcagg 
aaaagcatcc 
aaattgttat 
cacttgaggc 
actgaataac 
gatgcttgtt 
c'ttatcagta 
agtaataatt 
gggaagtata 
cccaaagcca 
tgaagaatca 
aaaataatra 
atgtctgagt 
agttaagtgt 
cttcaaacag 
cgctaaagtt 



ccacagga" t 
actggaacta 
atacaagtag 
atatcaagaa 
agcattaatt 
ataaaacaca 
aaaacccta z 
gccaaggcgg 
acccctctc . 
agctacrcgg 
agctgacacc 
ttaaacaaaa 
agcatacttt 
atattacata 
aataaaactt 
cattactita 
gatataaaca 
ctctggtttt 
tataagtagc 
atgatcagaa 
carttaccag 
aazacagtgt 
ttgagcacaa 
actggtcaat 
gctaattgtg 
caatggaggg 
atagagaaag 
ctgagaaatc 
gaatgtcaaa 
actgtgtatc 
tgaggaaaac 
aatgtaacaa 
acgtagaacc 
aaaataactg 
atgtggcaca 
acaatgacac 
tgcatatcaa 
aazgtacaca 
cttttagagc 
agtgggtggg 
agagttgaaa 
tcttgacaac 
gacacttaat 
atcagaatta 
acttattata 
aaattttctt 
gtgtggtaca 
ataagcccat 
gactagccaa 
aggtaaattc 
gtttaaattt 
cactaaaaag 
aagggcactt 
agaaacactt 
aaaagcagct 
ctaacccagg 
tctcacctac 
tataacatgg 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
L1940 
L2000 
12060 
L2120 
L2180 
L2240 
L2300 
L2360 
L2420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
L3140 
L3200 
13260 
13320 
13380 
13440 
13500 



WO 99/67395 



PCT/FR99/01513* 



63 

gaatatttat tattrtgttt ctaacacaaa taatttttaa aaacrca^'c tactaaagia 13560 
acatcaaagg gaaatttcat aaaaattctt ttgaaatttt tagaagtagr aaataaaggr 13620 
aagtgataaa tattttacag atttcaccac ttacgtaatc tgatcaacaa attttaaaaa 1368C 
catagcactt gaatactatt aaaaatatat taaaaaggta acatagtaaa actataaaa: 1374C 
tctttaaaaa aaatataaga ggaaaccttc gtgaccttgg attaggaaa;: ggttccrtar 13800 
atacggcaac ctaaaaatac aagcaaccaa agaaaaaaac agacaaactg gacctcatca I386C 
aagttaaaaa cttttgttct tcaaatgaca tcatcaagaa aataaatcrc acagaatgca 1392C 
acaaaaratt tgcaaaccat atctgataag agaccactat tcagaatatg taaagaat" 13980 
gtaaaactta taaataaaaa gttaaagaag tcaattttaa aacgagcaaa ggatctgaag 1404C 
acaattctcc taagaaatac gaatggctag ttaaatgcat caaaagatgc ttagcatcac 14100 
tggtcattag gaaagagcaa aaaccaaaat gacatactcc tccataccca ctaagactcr 14160 
tgtaattaaa actatagaaa ataagcgttg gcaaggatgt ggacaaat-g gaaccctcc- 14220 
catacactga tggtagaaat gtaaaatggt gcagatgctt tggaaaacag tctgacaata 14280 
ccccaaaggt ttaaacgtgg aattaccatg caacccagca attctactcc taagtatcca 14340 
cccaagagaa atgaaaatat atgttcacca aaacatttgt acataaatac taactgcacc 14400 
ttttattcat aatagccaaa aagtggagac aatccacatg tctatcaa" ggtgaattga 14 4 60 
taaacaaaat gtggtatctt catacaacta ttactgggcc acaaaaagaa tgatgtarer 14520 
atacatgcta caaaatgaat gaaccttaaa aacaatatgc aagcaaaaga aaccagacac 14 580 
aaaaggccat atattacatg atgctaatta cataaaatgt ccagaaggga gaaataaatt 14 640 
agtagttgcc aagggctgga gggaggggga atgatataag tgactgccaa tgggcatgcc 14700 
gtttcttttt agggtgatga aaatgttctg aaattttatc acgggaatgg ttgcacaact 147 60 
ctgtgtaact tagaattcag tgactcctaa aaccaatgaa cagcatgc" taaaaggtga 14820 
cctttgctga gcatagtggc tatagtccta gctacttggg aagctgaggc aagaggatca 14880 
cttgagccag gagttccagg ctgtactgca ctatgatcat acctgtaaa- agccaccaca 14 940 
cacaccagcc tgggcaacac agaccatgtc tctaaataaa taaacaaata aataaataaa 15000 
agggtgacct ctgtagtatt gagattatac ttcaagtaag crgttattaa aaaaaaaaaa 15060 
gttatcatat gggtggcagg ggaaatcatt ctgggatgat ggctaacttc atcagtatti 15120 
gatttatacc tatgcatcat accttatgtt tgttttatgc actttgtgcg ttttttaaaa 15180 
aaattatatt tcataaaaac aaattttaaa aaaattaaag tcaagaaccc caaaacaaca 15240 
aagatcagag atacatttct accttatcaa ttcagaaaaa ttacaagt" ttttcttaaa 15300 
aattgtatag catcatggtg attttaagtt acctgtagga atttaaataa ctttgtctta 15360 
actgttcacc aaaactcatt taatattcat gttctgatac tgaaaatgaa gctgaaaagt 15420 
tttgaaatta caatatgcta gtttaaaaag gtttactaaa atacataatt tcattataac 15480 
gagtaatatg aaataaaagt atcaaatatg ggaccattaa aaatgtcc" actaacaaat 15540 
tgctacccac attgtggact cactgcgtcc actgtttgcg agcttttcca gaacgctcgc 15600 
caccagttag ggtagccaag aactcctcat cttcactttc ttcctcacta gcttggaacc 15660 
tctggattcc cacccacact gctgtgacct gaatggggaa gagaaacgcc atagtaaggc 15720 
aactcttcct tttatagatt tctgaattag aatctggcat tacaaaagaa caatgttaca 15780 
aatccaggtc agagtttata gttctatttc actattactt atatggcttg tcctaggaac 15840 
ttaactatta tttacaatgt aagtacctat ttccacaaaa aaattcaaaa ttttggaata 15900 
caatatctga agagagaatg gtctattgaa tccaaagtag gctgatacat cccaacagta 15960 
tttcagattg agataataat aataccacca attcatcaag tcaaattata tgcttatttt 16020 
ccacaatgga agttttaaaa tagtataaac attttaatat atagcaggct taacttatga 16080 
ttattaaaca gggttctaag aaaatagtat acatcaaata tcaatgtgct tcttgtacaa 16140 
tttaggtgac aatttatcca tctgagaaat gcaaaagaga ctttggtaag gggttgagta 16200 
aggagcattc tgtgtcaaag aattcactag caaaagaggg tatactgtag ttacaagcta 16260 
taatcactgt acttatttta aatccctctt cagaaccagg tcttaaaaga tgataaaca- 16320 
ggcctcatga ataactatca accaaactat agaaaagagt gcaagagtgt ggtgttctaa 16380 
cttaaaatat ggtgttttat tcaaataatt ttatttaagg ctccaaaacc agcagcctca 164 40 
ttccccagaa atcatagtta aatgaaatct tccttactaa aggaaaaaig aatcacaata 16500 
tttaacgtga acattttaaa aacactctaa agcaacaaaa ccattcaatz gtatgtgata 16560 
tggcttagaa aggcatgtag gtaaaaagga ctaaaaactc taataatgcr tgggccaaaa 16620 
gtaaatttgt tagttctact ccattaagca ttcctcaagc agtgtaaaaa tcagagttca 16680 
agttacactt tgatgtgtag atcctttgaa agccactcta ccctgtttta tatgaagcar 16740 
ccgcagctaa aatgaacacc tagtgaagag tatgaatgct gcaatacata agcagacgtc 16800 
agaattgtcc caagctgatt ctaagttact ttaaacatgt atgcagagtc agaatatgac 16860 
ttacttctta gaagtaacag ataattacct ttggcataat gaaaaaaac- ttaaatgtaa 16920 
gttaatacag gtattttccc tttagcaaag ctttgctttt aaaagaaaec ttcaaaact- 16980 
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aaattaaaat aggaaatgct ctactatgta 
agaaaaggaa ggattctatg agggaggaaa 
agaaggaaag aaaagagaaa aggaggaaag 
tattattcct ttcaaatttt aaacgagcag 
taatctatgt tcctcttatc tatgcttgga 
tacattggat ttccgggtct tcagctctga 
ttctatattt catgtcattt ctatttgcaa 
tggttaaatg aagttcaaaa ataagtataa 
tgcacattaa ctcagccaca catctaacac 
tctgcagatt caactaacca tgggccgaaa 
ttttcttgtt atcattccct aactacagca 
tatgaaatat tataagtaat ctacagataa 
tatatgcaaa tactacacca ttttatatca 
ccagggaggt cctggaacta atcacccaga 
tcagtgaatt caggattcac artatttcac 
ttgtgtcaca acatatacat gcagacaggt 
gacatatggt ctactcaaat acggtttcca 
caaactcacc attccattga taagcgacct 
ataacagtgg ttctctgaac caatattgac 
aagctaacca ttgagaagta catactgttg 
aagatatcaa agtcagatga tacaactgaa 
gaattacatt ttaatatacc ataagcaatc 
aggagtttca agtatgcata tgtcaatatc 
tgcacacaac aatacgtaac tgtacttata 
atctgcatgc actgcaaagc aaaagtataa 
ataaaaccaa aaaacaggca tcacacacaa 
tgatatcctg atatgaaatg tcaaacaaaa 
ggacattagt ctttgtattt ttaaattgat 
ctatatatta cctacttaaa attattagca 
accaaaagca actctcatat ttacccaaaa 
gtaattctgt tcttaacaga caggtgttgt 
atgagaagaa cagaaaaaaa aattagaagg 
taagcagatt ttcttacacc atgaaattgt 
tcattctgga tgccgacatt ctctatgatg 
acataaagaa accaatatcc aatagtaaag 
ctaagctgaa gtttgcaact accaagaatg 
agcccatgtc aaccaatgaa aaatgggagg 
gttctaacta ttctaaggta taggctacct 
tccaagaaat tctaacatca actgtaatct 
cagtagactt acattttgta atattttctt 
gatataaata ctatcaaata attagctata 
tttaagccat ctcacattta acctaaactt 
ggtggctaac acctgtagtc ccagcacttt 
ccaggaattc gagaccaacc tgggcaacat 
aaattagctg cgcctggtgg tgtgcgcctg 
gagaatcacc agggcctggg agatcaaagc 
ccaccctggg tgacagagtg agaccctgtc 
aaaaaaatca aaactgatca cttgaggtcc 
ccaaagacat cttaaggaga gatgaaatca 
aagtcagtaa ggtcaatttt tacatatatt 
attattattt ttttttgaga cagagtcttg 
caatcatggc ttactgcaat gtctgccttc 
cctgagtagc tgggattaca ggtgtgcgtc 
tagagacagg gtttcaccac gttaaaccat 
aagtgctagg attacatgcg tgagccactg 
agaatttatt tgtggagaga ggtaaagaaa 
atcattcaca atctatcttt caaaatgagg 
catatactac atgcatgagc atgggaattg 
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gtaaaaatac tt" t t agate actgaagcaa 1*040 
agtgggagaa aaatgtaaag aaaaaaagga 17100 
aacacaagga cagaaaggee tatngaaata 1 ~ 160 
aataaattct t ttgttciat aactatgaaa 17220 
aaatttagac aaaatgc zaa gagtaagtac I 7 280 
aaacaagctg tttcttaaca tacgecaatt 17340 
atgttataaa gttcaatatg atgtaaaaca 17400 
catacattag uttggctatt ccaaatttca 17460 
agtcagccct ccctatccag gggttctgca 17520 
atgcttttgt accaaacatg tacaggctte 17580 
taacaactat tttcacagtg tgtacatgtg 17640 
tttaaagtat acaagagggt atgcataggt 17700 
gactctcaaa catcagtaga atttggcaac 17760 
ggtatcgaca gatggctata tataaatcac 17820 
aactagtata attttatgtt gttcacataa 17880 
gactttcatg aaaagattac acccaagata 17940 
aatgtgtatc caatcttgrt taattataac 15000 
ctaccaacct gcttatcccc tccaagcaat 13060 
cctcctttaa attgatagee ttttttraaa 18120 
aagacagaac atattctgta aaatgctccc 18180 
tgtttatgct agattatatt tctaagctga 18240 
tgcaaaagaa gcaacttgcc taaagatttc 18300 
tgtatcaata tgtaatatca atataatcaa 18360 
rcatctcctt agcactaatt attacaaaca 18420 
tataaaatcc caaaaaacct tgaaaattta 18480 
gaactgaggc gtatacttca ttaatgagta 18540 
ttacccaggc tcaggttaga aataaagata 18600 
tttttcttct aatattcctt aatgataacc 18660 
aatagttatt ttaaaagtat gagtaattag 18720 
gaaggaacca ctaccaagaa teaaagecta 18780 
gtattctggc atgttacatg aaaatcactt 18840 
tagctttcac tatggaaata ggtaagtgat 18900 
cagcagactc aataatcacc ctaaggggca 18960 
gaaagggact gaaagtaaaa tgcactaatg 19020 
ttgaagaaat aaacattctt tggacaggaa 19080 
tattatgeca gcagtaaatt aggaaactaa 19140 
actgaaatca atcattaaag cagcagcaag 19200 
ctggcgtata ttatcagagt tgacaattct 19260 
gaggtccttt aaaaaataat ataaaccagg 19320 
ctaagagctg tacattaaga ttttatttgt 19380 
gaacagctct attttcaaca gttataacat 19440 
ttatcaaatg tcaaaactga ggcegggtae 19500 
gggaggccaa gatgggcgga tcacttgagc 19560 
ggtgaaaccc catctctata aaaaatacaa 19620 
tagtcccagc tactagagag gctgagggag 19680 
tgcagtgagc tgagatcgtg ccactgcact 19740 
tcaaaaaaaa aaaaaaaaag aaagaaagaa 19800 
aacttatgtt tactatatct acttatattc 19860 
taaaaaggtg aggatgagaa agaaaatagt 19920 
aggctagcat aataaaaata tgagtgtctt 19980 
ctctgttgcc caggctggag tgcagtggtg 20040 
caggttcaag caatccttgt gcctcagcct 20100 
accctgccca gctaattttt gtattttcag 20160 
gagtttggcc aggatggtct caaactccca 20220 
cgtctggcct aaagtgtctt attataacca 20280 
actcattttt agtgaaataa ttaaaactgc 20340 
tattaactat tttggcttct aaaattaccc 20400 
aagttatttt attcctaagt tcgagacttc 20460 
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tagcaataac agatgggaca aacaagctaa 
aagaaatcca aagggggtct gaaaagttcr 
cacatgtata gagctgtgta cacgctcaaa 
tatgggaaac cctgaggctc tgtacaagaa 
cgtatcattg aaggcaatgc cccaacattc 
tactctagtt ctaggcattc aagaaaatcc 
ccaagcagta actttagggg cctgtgtgat 
ggaaagaaac taaacaagca acagcaacaa 
atctggtttc cagagttatt ctgttatact 
aaattacaaa gacatgcaaa gaaacaagta 
gaaactggcc ctgaaaaaga ccagatgctg 
attttaaata tgcgcaaaga actaaaaaaa 
agaacaatat ttctgatcct tcagaagaac 
tggtctagaa cttcttaaaa acagaatcat 
tactcaacac aatgttgtgt gagatttatc 
aaatagaaat tatagagata aataggagtt 
ttgaaaagca caaaaaccga atcaacttga 
agaatgaatc agcaaatcta aagataggtc 
aaggaaggaa aggaggctca gagacccaag 
aatgagaggc ccagaagaag atgcagaaaa 
ctaaacttcc cgaacttgac cccaaaaatt 
aaaaagaata aaatcaaagc gatccacacc 
taaagagaga ctctcaaaac aggcaaggga 
caaatttctc atcagaaatg atgttgtcaa 
gaaagaagta gaatgtctgg gacctggaat 
gggtggccaa ggtgggagga tcacttgagg 
aaagaggctc tgtctctaca aagaataaaa 
tagtcccagc tactcaggcg gctaaggtgg 
tgcagtgagc tatgactgtg ccactgcact 
aaaaatgtca accaaaaact acatgcagaa 
tgaagctctg aaggtgctta agactgtaga 
ggaatgtaag aaaattaaga cagccttgtt 
ttgcactgtt ctggttattg tcaagctatg 
cagaacagga tataaaatct tatcaggtaa 
aacttgaagg agaaggaata aggaaccaac 
gcttaaggta aaacaaacag ggaaataaaa 
ctaatctaac aaggaggggc ttaaactgat 
aaaaaacttt caggagtttc accagtccat 
ttgggctacc ctctttgggt cccctccctt 
atcttgcaac tgcactcttc tggtccgtgt 
ccatccacca ctgctgtttg ccgccatcgc 
tctagcaggg tgtccgttgt gctcctgatc 
ggctaaagac ttgccattgt tcctacgcgg 
gaacactagt cactgggttc cacggttctc 
taacactcac cgcgtggccc aagattccat 
ggtcagagaa cacgaggctt gccatcatct 
ctgggagcaa ggaccccctg gtaacaattt 
catgaaggga tctccaaagc ggtaatattg 
ccttagaatt ggaggaaaat actgggcacc 
cgccagactt tagactcagg tatgaggcta 
cccttctggg ttgggaacct tggtctgcct 
ggaagccaag ggctgactag aggcagaaag 
ttgagatcat gtcgcagcca gaagtctcta 
cttcccttct gtcccacacc tcctgggtcc 
aaaattctcc ttacctctga atctacttcc 
tgagactttc atttcctcta gcaagttgta 
tgcgccctta ggcatctagg ctataaaccc 
tttaggtata cagctctaga catgggcagt 
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ccaaaaaatt aaaagaaaaa cctgggaaa. 24000 
aacatattcc tgataatcca gaaagccata 24060 
aaacatctac gaaggcccca aactctcacc 24120 
gaaagtaaaa tccagttaca aatugcrtgc 24180 
acacataggc ccctggcaaa gattggaaga 24240 
cttctaatca tcagatga-c actaaactca 24300 
aaaaaataaa aacctgaaag aattagttca 24360 
caaaaacaga ccttgggaaa ggggggaagc 24 420 
arataaaata ttcaggtccc aacaacaaca 24480 
taagccacaa actgggggga aaaagcagca 24540 
gacttac-gg acaaagactr taagagagcr 24600 
agittatcta aagaactaca ggaaagtatc 24660 
cactttttgt cactacagat tagttctgcc 24720 
agagtatatt ctctttata* cagctcttr- 24780 
catgttgttg caugtatcac tcccaaacag 24840 
acaaaaaagt accaaacaaa aattctggac 24 900 
ggggcrcaac agctgatttg ggcagccaga 24 960 
aattgcgaga aagagaggga agaaggaagg 25020 
agacaccatc aggcatacca atatacata- 25080 
agggtcagag tatctgaaaa aataatggcc 25140 
aatctacaca tccaagaaga taaacaaac- 25200 
taggtacatc ataatcaaar gactgaaata 25260 
cttatgtaca aaacatcttc agattaataa 25320 
taggcaatca gatgacacaa tcaaagcacc 25380 
gctggtggac acctgtaatc tcagtatttt 25440 
caaggagttg aagaccagcc tgggcagcag 25500 
agattggctg aatgtggtgg tgtggacctg 25560 
aaagatcgct tgagcccagg agttggaggc 25620 
cttgcagtgg agaccctgtc tctataaaga 25680 
aaactgcact tcaagaaatg atcagtacct 25740 
tcaataccat agaaaataat ttagtattta 25800 
tgataactac acataatact gtaactgttc 25860 
agcacaaacc gatgactgaa atacagaata 25920 
agttaggcaa gcaattacta gttgtaattc 25980 
tcaaaccagg cagcaatgaa ttgtaaaaaa 26040 
caactcagaa cctaagcata tcgtaagaac 26100 
tattttacag cttgggtgca attatcccac 26160 
aaactatttg gttattagaa aatagcttta 26220 
tgtatgggag ctctgttttc actctattaa 26280 
ttgttacggc tcgagctgag ctttcactct 26340 
aggcctgcca ctgacttcca tccctctgga 26400 
cagtgagacg cccattgccg atcccgactg 264 60 
ctaagtgccc gggttcatcc taattgagct 26520 
ttctgtgacc cgtggctrct aatagagcta 26580 
ttattggaat ccatgaggcc aagaacccca 26640 
tagaagcagc ccgccaccat cttcggagtt 26700 
ggcgaccaca aagggacctg aacccgcaac 26760 
gaccactttt gcttgctact ctggcctatc 26820 
tgtcggccgg ttaaaaacga ttagcatggc 26880 
tctggggaag ggctttctaa caaccctcaa 2694 0 
ggagccagct tccactttca attttcctgg 27000 
ctgtcgtccc gaactcccgg cattagccgg 27060 
ctcaacagtc gcccatgcgt gcgctcctac 27120 
caaccacgac tttcttgaaa gtgtagcccc 27180 
tctgatccct gcctcctagg tactaatggr 27240 
tctccaaagg gatctaagga agctctatgc 27300 
agggagtctt gtccctggtg tccctcctga 27360 
tatgtgggac ctgttcccca ccacccttgc 27420 
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cagggcccca agtttgtaaa tggccaagag aggaaacaga gagagacaga gagaaagaca 27480 
cagtgagaga cagacagaga cagagagaga gagagacaga gaggagagag agagacacac 27540 
ggaggacagg gagagagaca gagaggagag ggagagagac aaagaggaga aagaggcaca 27 600 
gagacaaaca gggagtcaga gaaagaaaga caaagataga aatagtaaaa aaaaacagtg 27660 
tgccctattc ctttaaaagc cagggtaaat gtaaaaccca taattgataa ttgaaggtcc 27720 
tctccgcgac cctataacac tccaacacta ccttgttgtc agcgtaaaca agggcgtagc 277S0 
ctgaaaacac taagaccact gacaacccat agccttccta tcaaaaatcc ttaacatcca 27840 
gtgacctgcg gatggcccaa atgcattcaa tctgtagcgg caactgctcc gctaacagaa 27900 
aaaagtagaa aagtaacttt tagaggaaac ctcattgtga gcacacctca ccggt^caga 27960 
attattctaa gtcaaaaaag caaaaaggca gcttattaac tcaaaaatac taaagtatgc 28020 
ggctattctg tcagaaaaag gtaatttaac actaaccact gataattccc ttaaccctgc 28080 
agatttcctt acaggggatt caaatcttaa ttaccataca aaggtccgac cagacctagg 28140 
aggaactccc ttcaggacag gatgatagat ggttcctccc aaacgactga ggaaaaaacc 28200 
acaatgggta ttcagtaatt gatagggaga ctcntgtgga agcagagtta gaaaaattgc 28260 
ctaataattg gtctcctcaa atgtcagagc tgtttgcact cagccaagcc ttaacgcact 28320 
taccgaatca aaaagactat ctcaatcctg actcaaaagc ttacttatac cccctctgaa 28380 
acgaatttgc ctaagaactg ttgtttatgg gaatgcatct tgatggagca gctgggttgt 284 40 
tatgaaatac tcaggaactc agcctagctc taggactcac ccctgagcac aaaggcaatg 28500 
ttgggcacgc tggtaaagga ccactagaat ccagcagccc ggaccccttt ctttgtgatc 28560 
aagaaaggcg ggaaaagggg tgagggctgc tacatcagtg agcataacta atccgataag 28620 
cagaggtcca tgggtggtta cacaccccgg aaaggaataa gcattaggac catagaggac 28680 
gctctaggac taatgctcat cggaaaatga ctagtggtgc tggcatcccc atgttctttr 28740 
ttcagatagg aaacgttccc ctcaaggcaa aaacacccct aagatgtatt ctggagaatt 28800 
gggaccaatt tgactctcag atgctaagaa aaaaaagaca tattcttctg cagcaccgcc 28860 
tggcaacgat atactcttta agggggagaa acctggcatc ctgagggaag cataaattat 28920 
aacaccatct tacagctaga cctcttttgt agaaaagaag gcaaatggtg tgaagtgtca 28980 
tacgtacaaa ctttcttttc attaagagac aactcgcaat tatgtaaaaa gtgtgattta 29040 
tgccctacag gaagccctca gagtctacct ccctacccca gcatccccca gactccrtcc 29100 
ccaaataata aggacccccc ttcaacccaa acggtccaaa aggagataga caaaggggta 29160 
aacaactaac caaagaatgc caatattccc cgattatgcc ccctccaagc ggtgggagga 29220 
gaattcggcc cagccagagt gcacgtacct ttttctctct cagactttaa attaaaatag 29280 
acctaggtaa attctcagat aaccctaatg gctatattga tgttttacaa ggtttaggac 29340 
aatcctttga tctgatatgg agagatataa tgttactgct aaatcagaca ctaaccccaa 29400 
atgacagaag tgtcgccgta actgcagcct gagagtttgg cgatctctgg catctcagtc 29460 
aggtcaatga taggtcgaca acagaggaaa gagaacgatt ccccacaggc cagcaggcag 29520 
ttcccagtgt agaccctcac tgggacacag aatcagaaca tggagattgg tgccgcagac 29580 
atttgctaac ttgcgtgcta gaaggactaa ggaaaactag aaagaagcct gtgagttatt 29640 
caatgatgtc cactataaca cagggaaagg aagaaaatcc taccgccttt ctggagtgac 29700 
taacggaggc attgaggaag catacctctc tctgtcaact gactctactg aaggccaact 29760 
aatcttaaag gataagttta tcactcagtc agctacagac attaggaaaa aacttcaaaa 29820 
gtctgcctta ggcccggaac aaaacttaga aaccctattg aacttggcaa cctcagtttt 29880 
ttataataga gatcaggatg agcaggcaga atgggacaaa tgggataaaa aaaaggccac 2994 0 
cgctttagtc atggccctca ggcaagcgga ctttggaggc actggaaaag ggaaaagcta 30000 
ggcaaatcaa atgcctaata gggtttgctt ccagtgcggt ctacaaggac actttaaaaa 30060 
agattgtcca aatagaaata agccgccccc tcgtccatgc acctcgtgtc aagggaatca 30120 
ctgtaaggcc cactgcccca ggggacgtag gtcctctgag tcagaagcca ctaaccagat 30180 
gatccagcag caggactgag agtgcccggg gcaagcacca gcccatgcca tcaccctcac 3024 0 
agagccctgg gtatgcttga ccattgacgg ccaggaggct aactgtctcc tggacactgg 30300 
tgtggccttc tcagtcttat tttcctgtcc cagacaacgg tcctccagag ctgtcactat 30360 
ccaaggggtc ctaggacagc cagtcactag atacttctcc cagccactaa gttgtgactg 304 20 
gggaacttca ctcttttcac .atgcttttct aattatgcct gaaagcccaa ctcccttgtt 30480 
agggagagac attctagcaa aagcaggggc cattatacac ctgaacatag gagaacaccc 3054 0 
gtttgttgtc ccctgcttga ggaaggaatt aatcttgaag actgggcaac agaaggacaa 30600 
tatggacgag caaagaatgc ccgtcctgtt caagttaaac taaaggattc tgcctccttt 30660 
ccccaccaaa ggcagtaccc ccttagaccc gaggctcaac aaggactcca aaagattaag 30720 
gacctaaaag cccaaggcct agraaaagca tgcaatagcc cctacaataa tccaacttta 30780 
ggagtacaga aacccagtgg acagtggagg ttagtgcaag atctcaggat tatcaatgag 30840 
gtcactgtcc ctctatacct agctgtacct aacccttata ttctgctttc ccaaatacca 30900 
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gaggaagcag agtggtctac agacctggac 
catcctgact ctcaattctt aticgccttt 
acctggactg tttcacccca agggttcagg 
gcccaagact tgagccggtt ctcacacctg 
ttttactttt agccgccagt tcagaaaccr: 
attttctcgc tacctgtggc cacaaggttt 
aggttaaata cttagggcta aaattatcca 
gcttatcctc atcccaaaac cccaaagcaa 
tgccaaatat ggattcccag gtacggcgaa 
gaaactcaga aagccaatac ccatttagta 
caggccctaa agaaggccct aacccaagcc 
ttttctttac atgccacaga aaaaaacaga 
tgagcttgca acccatggca tacctgagta 
ctcattgttt atgggtagtg gcggcagtag 
tacaaggaag agatctgtgt agacatctca 
agacttgtgg ctgtcagaca accgtgagga 
ctcccttatc atatttttct ctttactgtr 
cctccatgct gctgtacaac cagcagctcc 
cttcccagaa atattgatgc cccaccaaat 
actgcccaca cccatatgcc ccacaactgc 
aatactcatt attggacagg gaaaatgatt 
actgtctgcc ggacttactt cacccatact 
caggcaagag aaaaacatgt aaaggaagta 
cctagcccct acaaaggact agatctctta 
tgcctggtaa gcctatttaa taccaccctc 
cctactaact gttggatgtg cctccccctg 
cctgaacaat ggaacaacta cagcacagaa 
cttgtttcca atctggaaat aacccatacc 
actgtagaca caaccaactc ccaatgcatc 
tgcctaccct caggaatatt ttttgtctgt 
tcttcagaat ctatgtgctt cctctcattc 
aagatttata caattatgtt gtacctaagc 
ttgttatcgg agcaggagtg ctaggtggac 
ctactcagtt ctactacaaa ctatctcaag 
actccctggt caccttgcaa gatcaactta 
gaagagcttt agacttgcta acctctgaaa 
aatgttgtta ttatgttatt ttagcggaag 
ttgtcacaga gaaagttgaa gaaattcgag 
aaaaacacca gaccctgggg cctcctcagc 
ggatctctag cagctctaat attgatactc 
gttaagtttg tctcttccag aatcaaagtt 
ccccagatga agtccatgac taagatctac 
tgctccaatt gtaatgatat cgaacgcacc 
ctactatgcc ccaattccgc aggaagcagt 
gcacttgggt tttcctgttg agtgggggga 
gccgactaag aatcccaaag cctagctggg 
gcttgcaact tagctcacac ccgaccaatc 
attagacaaa aacaggaggt aaaaaaatag 
gaaggacaat gatcgggata taaacccagg 
ggtcccctcc ctttgtatgg gagctctctc 
aaaaaaaaaa tagcttaatt gaagaataaa 
atacagttca aactgtaaca gtgttacagt 
gcatttccat catgccctaa aagttccttc 
tacaccctcc tgacctggcc cagaccttgg 
tattagtttt gtctgttcta gaacttctta 
tattggttct ttttactcaa tgtaatgttc 
tattcctttt aatcctgaat agtatgctgt 
ttacctgttg acagatatct gagctattat 
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cttaaggatg cctttttctg catccctgta 30960 
gaagatccct caaacccaat gtczcaaczc 31020 
gatagccccc acctatttgg zcaqqcazza 31080 
ggcactcctg ccctttggta tgtggatgat 3114G 
tgtgccatca agtcacccaa gtgctcttaa 31200 
ccaaaccaaa ggctcagctc tgctcacagc 31260 
aaggcaccag ggccctcagt: gcctattctg 31320 
craagaggat tccttgacac aacaggtttc 31380 
atagccagac cattatatac actaattaag 31440 
agatggacac ctgaagcaga agcggctttc 31500 
ccagtgttta gcttgccaac ggggcaagac 31560 
aatagctcta ggagtcctta cacagctcga 31620 
aggaaattga tgtagtggca aagggttggc 31680 
cagtcttagt atctgaagca gttaaaataa 31740 
taacgtgaac ggcatactca ctgctaaagc 31800 
aagtaactaa aatcgtaaat ccccatggcc 31860 
ctcttacccc ctttcaccct cactgcaccc 31320 
ccttaccaag agrttctatg aagaatgcgg 31980 
aggagtttac ctaaaggaaa ctccaccttc 32040 
tataactctg ccactctttg catgcatgca 32100 
aatcctagtt gtcctggaag acttggagcc 32160 
ggtatgtctg aggggggtgg agttcaagat 32220 
acctcccaac tgacccgggt acatagcacc 32280 
aaactacatg aaaccctcca tacccatact 32340 
actgggctcc atgaggtctc ggcccaaaac 32400 
tatttcaggc cargcatttc aarccctgta 32460 
ataaacacca cttccgtttt agtaggacct 32520 
tcaaacctca ccrgtgtaaa atttagcaat 32580 
aggtgggtaa ctcctcccac acgaatagtc 32640 
ggtaccttag cctatcgttg tttgaatggc 32700 
ttagtgcccc catgaccatt tacactgaac 32760 
cccacaacaa aagagtactc attcttcctt 32820 
taggttctgg cattggcggt accacaacct 32880 
aactcaatgg tgacatggaa tgggtcgccg 32940 
acttcctagc atcagtagtc cttcaaaatt 33000 
gagggggaag ctgtttatct ttaggggaag 33060 
aatgttgtta ttatgttaat caatcctgaa 33120 
attgaataca acgtagaaca gaggagcttc 33180 
caatggatgc cctggattct ccccttctta 3324 0 
ctctttggac cctgtatctt taacctcctt 33300 
gtaaagctac aaatcgttct tcaaatggaa 33360 
cgtggacccc tggaccggcc tactagccca 33420 
cctcccgagg aaatctcaac tgcacaaccc 33480 
tagactggtc gtcagccaac ctccccaaca 3354 0 
ctgagagaca ggattagctg gatttcctag 33600 
aaggtgacca catccacctt taaacactgg 33660 
aggtagtaaa gagagctcac taaaatgcta 33720 
ccaatcatct atcgcctgag agcacagcgg 33780 
cattcaagcc ggcaacggct accttctttg 33840 
tgtctccact ctactaaata ttgcaactgc 33900 
ttaatacaat aaaaggaata cattttaagt 33960 
ttcaagagga ccccttcaac aagatattgg 34020 
ttgtccctta ctggttgggt ccatctctac 34080 
cctcagaaga atcatttttt tgtcactaca 34140 
aaaacagaat catagagtat gttctctttg 34200 
tgtgacattt atccatatta ttgcatgtac 34260 
tttaggaata taatgcaatt gtttattcat 34320 
gatggatatt atgaataatt ccgctatgaa 34380 
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cacttctgta caatgttttc tcggacatat 
aactgttgga tcagaaagta agcatatgtt 
ctaaagtgat ttgtaccatt ttacactccc 
cacagccttt ttactacttt gttaatcttt 
atctagggaa cgtgaagtag catctcactg 
tcgtgtatct tttcatgtgc ttattagcca 
aaatttgtaa ctaaaggtgc tttcctgagt 
aataaactac agtcttggaa tgaaaaatta 
gttttactct gtgtatgtct ggttcgctta 
cacagtgctt atttcactaa tgagtatcac 
tgaactcaat aaatatgtta atgtgtatgc 
atacacacat ataaacatat attaattttt 
gagcctctgg tttgaagaat tctcaaatca 
cactgtacct gaaatagccc tactgttcta 
aaataattaa gattccaact aattttaaaa 
tacataaaaa gaaaatttta aataaaagca 
gggctgtatt tctttaatcc tttaaaattc 
ttaactgaac caaactatgc ccatgaaaga 
acatattcat cttcttgcaa aaaagatatt 
attttgaggc agatttgtac tttagtcctt 
gtctggtcat tgacctccaa cttaaaaaat 
ttatgaaagt caaacaaggt agcataaagg 
agattttaaa aatcactcta catcccataa 
agaaaataac aattattgcc taattgaaaa 
atgaacatta tagtacatca tattacgagc 
aggatttcct tagtttgttc atatagttta 
gcattgtgag gagcataaag acataagcac 
taaagaagac ttcttcttgg gtatttaatc 
attaacttca tagactgacc ttagattact 
tctttaacat accagtattt atcttataac 
ccttttaagc actaagcatc cattctatac 
atatttttaa aacttttatt tacttttatt 
aggctggagt acagtggcat gatcttggct 
ttcaagtgaa caaatcatac ttttaagcac 
tgccataact agggtgtgaa ttaagtatta 
atatatctct aaatgaaaaa gaacatatta 
taacccatcc ctctctcccc tttcctccaa 
ctgagctaag cagctcctgg ggttggggaa 
cagtgttttc ctctctggga ggaactagca 
gctgaatcct ttctattcct gaggcagaca 
accaagagcc ctgccaggta ttgatacctt 
tacaaatgct aaataagtat ctttgaaata 
aaaatgggta gtatttttta ataacctgat 
ttatggaatg aaaacacaga ggtaccaaat 
aacccaataa cttcatcaaa ctagcaaata 
gaaggaaatc acttagatct gataaagact 
aactgtatca attaatacca gaaaacaaac 
cagcacagtc ttggtaatgc aatactataa 
gtttgtaaaa acacaatagg atgagatttt 
tggaaacaaa ataaagaaaa acaaaatcta 
tctatttgaa gaaaacctta aaatctatgc 
aatatcatgt tcttgtctgg gaagacttaa 
taaatcgaaa tttaatgtat ttccatctct 
aagtgatttt aaaagtcatg gaaaattaat 
aaggagacaa atgaattgct ccaacagata 
ctaggataag aaaatacata tactgatgta 
taagtcaaac tactttacta taaaccaggg 
gtaagaagtg agtaaactat ggcccactgg 
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attttcattt ttct~gagtg gagctgttag 34440 
gaattttgaa agaaactggt aaaczctzzz 34500 
actaataatg tatgagagtt atacttgctc 34560 
ttagtactgt caaccctttt aazzzazczs. 34620 
ttattttcat tttcctgatg agtaacaata 34680 
ttcctatatc ttttgtgaaa tagttaac" 34~40 
ttcaggtagt aagcctattt ccctcaagtg 34 800 
aacacagtgg agacattttt tgtataagrt 34860 
gtctattatt atatgcccca tgaaagcaaa 34920 
tagcacatag aactgtgctt gcccaaagca 34980 
atgcacatac atctacatgc atataca:c: 35040 
agacccacaa atctaagaaa actaattctt 35100 
ttaacatatc tttatgttcc actccaca:: 35160 
ctttggtaaa tcaggcaaat ttaat-tt" 35220 
tataatttga aagttaacaa tgaaatacac 35280 
aaactaaacc caataagagg aaagaaagt- 35340 
aaatcacaca atgctccaat gaaatcttca 35400 
tctcatatgc aactgctaaa acctcaataa 354 60 
tctttataat atgcacatac agtatatac- 35520 
gttccattgc ttaccggctg gctgtcct" 35580 
aatacttgcc ttgtctaccc cacagaactg 35640 
tattttacaa gatataaagt gctataatac 35700 
tactttgttg tacaatttta gagcaatact 35760 
tccagtcccg aattccataa aatgtatgat 35820 
cccaaataat cactgcttat atagttggtt 35880 
tatatttatg cagtccctat tttgtgagag 35940 
agtacagagc cttagcttct ctacatttac 36000 
aatatttaaa gtattctggg aagaaatgaa 36060 
atcattacaa aaagatgcct gagtgatctg 36120 
tgttatattt acttgaatca gaagtgaact 36180 
tttcttgtct ttacatatga gatacaaatc 36240 
ttttagagac ggagtcttgc tctgtagccc 36300 
caccacaatc tccacctcca cttcccaggg 36360 
agattctcaa catgtatcct agcatgctac 36420 
aagacagctt accccaaata ttactgtaac 36480 
acaactatac ttggatggga ttctgggacc 36540 
attccatctc ctattaacac accagctctc 36600 
gggtgtacat ggagaaagct agaacctcta 36660 
ggcatacgaa cagaaaaagc tgaataaaag 36720 
gagagaagac cagggaacaa agagacttcg 36780 
tgatactgag aaaatatctg ggatatgaaa 36840 
ggggtaaaag aataaagggt cttgatgagt 36900 
aatgagcttt aggaaaaggg aaggtcaacg 36960 
ttaaaagcat aaaaaaaagt ggaggggggg 37020 
acttagtatc atttctaatt agaaacgcta 37080 
aggctataat tctaactgat gaaacactta 37140 
acagaaaagt ctactagaac catcattatt 37200 
tagcaatgca ataaagcaag aaaaaaaaaa 37260 
tgtttttcca atgccataaa taactagaaa 37320 
caaaacacct ggaaataaaa agaaaaatgg 37380 
agaacataaa acaaaatctg aataaaaaga 37440 
tatcataaga aagtgaatta tatcaaaatt 37500 
aatcagacag gacactatgg ggaactgaat 37560 
aactgagaat aaccatgaaa agtatgaaaa 37620 
tcagaacgct aaaattaaat aaaaatacta 37680 
atgaataaag aatccagaat tagattccag 37740 
gtggcatatt catccagtgg gaaaaggaca 37800 
ccaaattgcg gcctctgcct atttttgcaa 37860 
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ataaagtttt 
atgttacaga 
actatctggc 
tctcatagac 
acggggtctt 
cctcaacctc 
tgtgtgccac 
taagaaaaag 
tcaagatgaa 
taaaaattat 
ataaaattat 
gcaatttaca 
ctaagtgtga 
aaaaatcaga 
atatactgtt 
ttttaatctc 
aaaaatacat 
cttgatagtg 
taaaaaagaa 
aggccaaagc 
aaaaccctgg 
tcccagctac 
agtgagccaa 
acaaaaagaa 
aatgggcaaa 
tgcagagcac 
acagaaaata 
gggaatgtaa 
aaataaaatt 
aacagggtgt 
atatttgttc 
atttaaattg 
ctactcagtt 
gcaacagact 
accctggctt 
caaaaccagg 
ctaccaccac 
ggcagcatta 
aaaatgtggt 
ctatctatat 
ttcaccatgt 
cttcccaaag 
ctgacacata 
tcacaaaaag 
cataaagtag 
agaaaagagt 
tggttaagat 
ataatattaa 
cattcacctg 
ttattacaaa 
aatattcagt 
gttattgcaa 
atcaacatcg 
catatttcta 
gagtctaaaa 
agtttccatt 
atttttagca 
aaagaattaa 



actgggacaa 
atcacacagt 
ccttgaagaa 
acctatctca 
gctctgttga 
ccaggttcaa 
tacgcctggc 
aagggcatat 
ttatacagtt 
tttataaaat 
tttataaaat 
gaaaaccaag 
gagaattatt 
gttataatgc 
agtgaaaatt 
taccttttga 
atgcttactg 
aatactgaac 
taaattaggc 
aggcggatca 
ctctacaaaa 
tcaggaggct 
gatcatgcca 
caaattaaac 
ggacttgaat 
tattcattag 
ataaatattg 
agtggtacag 
atcttatgat 
acacccattt 
aaatattctt 
gtggattctg 
gaaggtctta 
gcctttggac 
ggtgagtcca 
aaagccaatt 
caccatgatg 
ttcacaatag 
atgtatatac 
ctatacacac 
tgtcaaggct 
tgctgagatt 
atacaatata 
gcaattagtg 
aatggggaaa 
tttggagaat 
tataaatttt 
ggaaaaatac 
ggaaacagaa 
tgatgttgtg 
ttactaacca 
gatatctact 
ctaaaaccct 
ctgtcctcac 
tttggctcct 
ttcaaaaatg 
catagaagtt 
aatattaatg 



agccaagcct 
ttcaacagag 
agtttgccaa 
cacaacacat 
ccaggctgga 
gtaatgcccc 
taaggggcct 
ttgatatata 
atattttgca 
atctttaata 
aaaaagttaa 
tccaaatggt 
agttaaagta 
cctattgctg 
taaactaata 
tgcaaaaact 
tagtactgtt 
aaattacagt 
tgggtgcggt 
cttgaggcca 
aatacaaaaa 
gaggcaggag 
cagcattcca 
cctacaactc 
agacatttct 
tgattacatc 
gtgaagatct 
ctactacgga 
aggaatatgc 
caacatttac 
ctggatgctt 
agtacagcag 
cagaaaaaga 
tcaactgcaa 
gggtctgatg 
cattaaaata 
gttctgtttc 
ccaaaaggtg 
aatggaatat 
atactcacac 
ggtctcgaac 
acatgtgtga 
gataaacaat 
tatgattcct 
cagagagttg 
gaatgtacaa 
atgttacatt 
tataaataac 
tacatcctat 
tatctttttg 
gtaagtcctt 
aaaatggaaa 
ggaggggaag 
ttttcaaaat 
tcttcagttt 
tactttttct 
aaatagattt 
gcgctttaat 



atcatttgca 
accaccttgt 
acctcagttt 
tgtgggaaag 
ctgtagtggc 
caccacagaa 
ttttaacaga 
tttatatttt 
atgtgtttga 
tatttataga 
gaagaaaaga 
caacaaagat 
aaaatatctc 
gtggagatgt 
catttttgaa 
catttttggg 
tataatggta 
gcatctacag 
ggctcatgcc 
ggagttcgag 
ttagtcgggc 
aatcacttga 
gtccaggtga 
atcaacaaaa 
tcaaggatga 
ccacatgcat 
gaaaaacaga 
aaacagtatg 
atttctgggt 
atgtcaattc 
ctatatatat 
attaccatcc 
ctgacctccc 
ctcttccttg 
aggtaggctg 
aatctctctc 
tctggagaat 
gaagcaactc 
tattaagcct 
acacacacac 
tcctgggctc 
gccaccacac 
gaggacatca 
cttgtatgag 
tttaatgggt 
cagtgtgaac 
tattttacca 
aacaacaaaa 
tctgctagag 
aaatgactga 
ctttcatggt 
acaactgaaa 
aatcctaaca 
ccagaaatca 
agaaggtgcc 
ctccccaaac 
gcttaaccaa 
gatacaaatg 



aattgtctac 
ctacaaagct 
atataataaa 
gaccttcttt 
atgaccatgg 
ccccaaacag 
gaaagaaatc 
ttatatagat 
cggtaaaagt 
tattataata 
taggcaaaac 
aaaacagatt 
tctataccca 
aagggcagaa 
aagtaagctg 
tacctattcc 
aaaactagaa 
attaaacata 
cgtaatccca 
accagcctgg 
atggtggtgg 
gcctgggaga 
cagaacgaga 
atacccaaac 
taaacaagca 
taggatggct 
aacctttgtg 
gccattcctc 
aaatacccca 
aactgggcca 
gttttttggc 
acaatgtagg 
ttgagcaaga 
agtcaacagc 
cagactcaag 
tacacaaaca 
gctaatacac 
cagcagatga 
ttaaaaagtg 
acatttatag 
aagcaaaccg 
ccagccaaaa 
tgatatgcga 
gtacctatgg 
atagagtttg 
ataattaaca 
tgattaaaaa 
aaaacacctc 
atatatctgc 
aaaactaaat 
tcctgacttt 
aggcaaaatt 
aacatggcca 
acatttctgg 
aagttaatcc 
cggtatctag 
aatagccagc 
aacaacttta 



aaa tat tree 
gaaaataccc 
agatcagcta 
ttttt ttgag 
ctcactgcag 
ctgggagaga 
cacatactac 
atcataaaaa 
ttaatatcta 
taaaatatct 
aaaatacagt 
tataaactca 
caatactact 
gcatgctctc 
gcaatttttt 
ataccttaaa 
aaaaagaaaa 
atgcacccat 
gcactttggg 
ccaacatggc 
gcacctgtag 
cagagattgc 
ctctgtctca 
ccaattcaaa 
catgaaaaga 
agtatgaaga 
cactgttggt 
aagaaaataa 
aataactgaa 
gaatacccag 
tgaggttaac 
tgggectcat 
aagaattcag 
ccatcccatc 
gaagagctgc 
cacacacaca 
ccctgttcat 
atggagaagc 
gaaattatat 
aagacagggt 
cctgcctcag 
aaaggacatt 
aataagcctg 
atgtcaaatc 
ttttgeaaga 
ctactgaaaa 
ttaaaacaaa 
aagcaactta 
agttcaaaat 
taaaagcaat 
tctgtaagat 
ataatttctt 
taatttgeca 
aaacaaaaca 
ctgacatcct 
attcttaaat 
aaacctccca 
cattcaatcg 



37920 
37930 
35040 
33100 
33160 
33220 
33280 
38340 
33400 
38460 
33520 
38580 
33640 
33700 
33760 
38820 
38880 
38940 
39000 
39060 
39120 
39180 
39240 
39300 
39360 
39420 
39480 
39540 
39600 
39660 
39720 
39780 
39840 
39900 
39960 
40020 
40080 
40140 
40200 
40260 
40320 
40380 
40440 
40500 
40560 
40620 
40680 
40740 
40800 
40860 
40920 
40980 
41040 
41100 
41160 
41220 
41280 
41340 
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tcaatgggaa aggaagcaga attctgagga 
tctactttat tttacttctt tgtaactaat 
tacaaaaatt agccaggcat ggcacatgcc 
gggtggatcg cttgagccgg gaaggcagag 
ctcaagcctg ggtgacagag caagaccctc 
ggcgcagtgg ctcacacttg taattccagc 
tgaggtcagg agttctagac cagcctgacc 
tacaaaaatt agccaggcat ggtggtgggc 
ggcaggaaaa tcgcctgaac ccaagaggcg 
gcactccagc ctgggcgaca gagcaagact 
ataaaattaa aaaatatata aaaataaaac 
tttttttttt ttttttttaa agatagggtc 
gcatgatcat ggctcactgc aaccttgacc 
cctcccaagt agctgggact acaggtgctt 
tttttgtaga ggtggggtct cactatgttg 
agaaaacaag cattgtttta tcagcttctt 
ggttgtttct atgaagattc tctaaattta 
aagtagatga ctgaatgatc tttgttgaat 
atctcttaag atctcccatt ctttacagga 
ttttaccttt gcagccttat ccaaactctg 
tacaacgtcc ccctttgcct acaaagctct 
cctatctgtc aaatctctgg gaatgcaaca 
actagaacaa attcttcctg gggcattagg 
agcaatcaca gttccaatgt tatatttgta 
agactataac cttctaaggg gtcacacata 
tagcacaggg catggcaggc aaatatgtgt 
acacactttt cttacccaaa gtataatggc 
gaaaaacaga tatgatgtgc ttaattttca 
attcacagtc attttacaaa tctttttgac 
aagtgctaaa taacattttg gttacattct 
agaatactgg ctaatatgaa gcacctggac 
caaactaaac tgttatgtaa atgacagaaa 
tggcttttgg accaattcaa cttttaccac 
tgagctcatg ataaatgaat tacagatgaa 
aagtttatct tcaaagaata ccaccagtca 
ggtcagggca gacttcactt ttcatgataa 
attacaaaca aaagtcatag tttgctcata 
ccatttttca tttgttcact gaggcaagtg 
catgtaaaat cagataatga ttcctattcc 
gatgggcctc actcaagcat gctcagtact 
tctattagga ttctgcaaag taaaataaat 
gaatctagat tttcagattt tccttaaatt 
agagatttgt atctagtatt ttaaagaaat 
aaatgctaca tttaacaaac agaatatcac 
tcagcaacag aaatctgatg ttgcctttag 
tccatcctcc tttggtcaag gccatggttg 
aagccaggaa atggcaaatt agcaaaaact 
atctcacttc taaaacttta attaaattca 
ccaaaaggaa agttatgtag gtcaaatgag 
tttctgttta aggaaaaact gcccaagtgc 
ctgccgagag tccccatctg gcagccaggt 
cctcccactt tctatctaat tatagcactt 
tctctctctc tctctctctc acacacacac 
tttctctctc tctctctctg aaacttatct 
ttaatctgac aattttcccc taaaacagaa 
acacatgcac tatattctga caataataat 
caggagttta aagaagttac agtaaagaat 
acccaaataa gtgctgagag gtataaatct 
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ttatgaaagt aaacaaaacg aagttcaaat -314CC 
gaacaacttc ttccaaagac aagtaggaaa 4146C 
tgtagtcctg gttacttgga aggctgaag- 4 1520 
gctgtagrga gctgagatca catcac.gca 4153C 
tctggggaaa aaaaaaaaaa aaazacgctg 41640 
actttgggag gctgaggcag gtggtzcacc 417GC 
aatatggcga aaccctgtct ctactaaaaa 41760 
aattgtaatc ctagctactc gggaggctga 41820 
gaggtttcag tgagccgaga ttgcactagz 41880 
tcatctcaaa ataaataaat aagtaagtaa 41940 
aaagataagt aggaaccatc ctttttrtt- 42000 
tgtttctgat gcccaggctt gagtgtagtg 42060 
tctcaaatac aagtgactct cctaccccag 4212C 
accaccccat ccggctcatt taaaaaaatz 42180 
tatccaggct ggtctcatt I taactttat" 4224C 
gtttttttaa aactaaaaac aacactgcta 42300 
tttataacct taagaataac atgtacaaca 42360 
aaatatgaat ggatattcaa ataattaaaa 42420 
tacagagaaa actcgttaat atggcctgac 42480 
tggtcaagac aaacaggttg tccttatac^ 42540 
tcccatgact ctttgcctat cttaagttca 42600 
tttcctcaag gtagccttct ctcctcccaa 42660 
tttttattgc actgtatgtc tcttcttcac 42720 
ttcttagttg atttg-ttct ttccaccttt 42780 
atatcgatca tcagttgtat cccttgrgca 42840 
gtaaataaac ttgttgaatg aatcaatgag 42900 
aggataacat ttatcaatct attgctrctr 42960 
ttttacatct caaataccaa tgcctaagga 43020 
aaatgcctrc attaatcacc acctgt'tac 43080 
gtaacatttic ctgcacttaa tgtcatctc- 43140 
ttcaggaaca caaacctgaa actaacacac 4 3200 
tgacacattt tggtctgcaa catctctaga 4 3260 
taaaaatcgg tcacctgact atagtcattt 43320 
aaataaatag tttgatgaca atctttacaa 43380 
caggtattct aggctcctat caact-attt 43440 
ttatgttctg aaaattctac aaacttaatg 43500 
aatcaggcct aggtctggat tctagttctt 43560 
acttaaaatt ccctagcctc agtttcctca 43620 
taagatggtt ttgaggctrc aacaagataa 43680 
ctgtctctct ctctccggtt atgcagaaat 4 3740 
atttcagtaa aaattatgcc ctttattaat 43800 
tacttagtaa cttaagggct caaatattat 43860 
gaaaggtgtt aatcaaaatg ctgcacaaat 4 3920 
aaccatacaa actaatcaga tataaagaag 4 3980 
atcacacaat taggcaaaca aaaatagagt 44040 
aagactgaat accaaatagg gaaataggaa 44100 
ggactcctta atttttatat tcattttcat 44160 
aataaaaacc . aaaatggaac tgagataaag 44220 
aacctatatt gtccttaggc tctttgttgc 44280 
cttgacacat taaagatcaa gcaggaggtt 4 4340 
tttgtcaagc aaattttgag aattctctac 44400 
tataaaaacc attctctctc tgtctctgtc 44460 
acacacacac acacacacac acacacaccc 4 4520 
gtattataat aacacaacac taggtatgga 44580 
taaattcaaa aaggaaaacc ttccctctgt 44640 
tcctaaatta agtataatac attttcccta 44700 
ctcttgtata aataratatg ccagaacttg 44760 
caaaacagtt tccggactct ttgtgaaatg 44820 
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tcttcagagt ctgcgatata ttttcttcaa 
gctgtgggaa tgccttacgg catgttacrg 
aataattaaa ataaaattga caaatgataa 
gggcactttt ctagaacctg gacacaaagc 
aaaatatgga ctatttgaaa attatacctg 
agtatattga gatgtttact ttcaattaga 
atgtgatggc tctataaaag attctaaaat 
tgggatacta aaaatggcta caaagaaagt 
tcctactaga ttagagtcta agcctgtgac 
ttttctcatt aatagtatgt aacttacttc 
atatttgcta aatgtcaata tttatgccag 
tttacctcat gcaaatatgc tgtgagaaag 
caacactgaa gactcaccat ccaaaacaaa 
agttctgttc tataaggtta ccacaaacac 
ttatgtttcc gtgagccctc ggtcacaaca 
ttctatgtgt gtttctgttt aaaaagagca 
acagcaaaat cactaataaa aagcacaaaa 
acaagaaggc ttgtttatag tatgacagct 
aacctctgct gggaaatgag catcaggtga 
aaagtgctcc aagtactgac tttggggtta 
ccaatatgaa atctacaaat aatgagtacc 
gtatctgact tgattgccac tgaaagacac 
agttactatg cagacaaaga gttctacact 
tcataaatgg atgtttttta aaatgttatr 
acgaaatcca ttttcttctg caggatattc 
gtcaaatctg tctgtaatga 
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ctaaattata caagtaagat attttgctgg 44880 
tggagctcat ggtaaaatag aaagaatata 44940 
atgatttaat aaattagaaa ttcaaacgcc 45000 
atgaacctaa caataacccc gccttcatga 45060 
caacactaaa taaatattct tcattcttcc 45120 
caatttgctt tcctctctga acacatagtt 45180 
aactatagaa ggaactactg gtaaagactg 45240 
tatgacaaaa cctctgagtt tgaacggaag 45300 
attatgcttc tggt-cttgt tcttaaatgc 45360 
ctggaatgcc attcattaaa aaaatattta 45420 
cactttraaa gtacagaaac atggagtctc 45480 
acttaagagc ctattgccta ctttgtggta 4 5540 
cagacttagt aaattcttgt gatttgcagt 45600 
tgaaatcatc gctcctgggg gaatacaagg 4 5660 
cgttcattaa ctgatcaata cacaaccttg 45720 
cttcagtgct acatttggag tczgttttaa 45780 
acgtaaaagc atggcactac atacactgrg 45840 
gagacaagaa ggtagagcct cgcrttgacc 4 5900 
accaattttr caccactctg aatgaccgta 45960 
cacataaatt ttagtaagca tgtgaatctg 4 6020 
aaatgcatat gagtcaaata tttcagtgcg 46080 
agtttggaaa acccctaata aataccgttt 46140 
agagtgcttc aattaagatg tctgaggctt 4 6200 
tcctacctga tatattctaa aggggatata 4 6260 
catgagtttc cgattgatgg cccaaaactg 46320 

46340 



<210> 67 
<211> 773 
<212> ADN 

<213> Homo sapiens 
<400> 67 

actgagagac aggactagct ggatttccta 
gaaggtgacc acatccacct ttaaacacgg 
gaaggtgacc acaccctcct ttaaacacag 
caggtagtaa agagagctca ctaaaatacc 
aatcaaatca tctatcgcct gagagcacag 
aggcatttga gccagatcag gtaaccctct 
gttttcactc tattaaatct tgcaactgca 
aagctgagct tttgctcgcc gtccaccact 
gacttccacc cctccggatc cggcagagtg 
cattgccact cccgatcagg ctaaaggctt 
gttcatccta atcaggctga acactggtcg 
cagcttctaa tagagctata acactcacca 
atgaggccaa gaaccccagg tcagagaata 



ggctgactaa gaatccctaa gcctagctgg 60 
ggcttgcaac ttagctcaca cctgaccaag 120 
agcttgtaac tcagctcaca cccgaccaat 180 
aattaggcta aaaacaggag gtaaagaaar 240 
ggggagggac aatgatcggg atataaaccc 300 
ttgggtcccc tcacactgca tgggagctct 360 
cactcttctg gtccatgttt gttccggctc 420 
gctgaatgcc gccattgcag acctgccctt 480 
tccgctgcac tcctgatcca gcgaggcacc 540 
gccattgttc ctgcacagct aagtgcctgg 600 
ctgggttcca cggttctctt ccatgactca 660 
catggcccaa ggttccattc gttggaatcc 720 
aaaggcccgc cccatcttgg gag 773 



<210> 68 

<211> 10 

<212> PRT 

<213> Homo sapiens 



<400> 68 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
1 5 10 
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<210> 69 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 69 

Leu Leu Phe Gly Pro Cys lie Phe Asn Leu 
1 5 10 



<210> 70 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 70 

Cys Leu Pro Leu Asn Phe Arg Pro Tyr Val 
15 10 



<210> 71 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 71 

Gly Leu Leu Ser Gin Trp Met Pro Trp He 
1 5 10 



<210> 72 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 72 

Cys Leu Pro Ser Gly He Phe Phe Val 
1 5 



<210> 73 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 73 

Trp Met Pro Trp He Leu Pro Phe Leu 
1 5 



WO 99/67395 
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<210> 74 

<211> 10 

<212> ?RT 

<213> Homo sapiens 

<400> 74 

lie Arg Trp Val Thr Pro Pro Thr Gin lie 
15 10 



<210> 75 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 75 

Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu 
15 10 



<210> 76 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 76 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
15 10 



<210> 77 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 77 

Lys Arg Val Pro lie Leu Pro Phe Val He 
1 5 10 



<210> 78 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 78 

Cys Arg Cys Met Thr Ser Ser Ser Pro Tyr 
1 5 10 
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<210> 79 

<211> 10 

<212> PRT 

<213> Homo sapiens 



<400> 79 

Thr Arg Val His Gly Thr Ser Ser Pro Tyr 
15 10 



<210> 80 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 80 

Ala Arg Glu Lys His Val Lys Glu Val He 
15 10 



<210> 81 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 81 

Ser Arg He Glu Ala Val Lys Leu Gin Met 
15 10 



<210> 82 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 82 

Ser Gin Trp Met Pro Trp He Leu Pro Phe 
15 10 



<210> 83 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 83 

Cys Tyr Tyr Val Asn Gin Ser Gly He 
1 5 
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<210> 84 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 84 

Phe Tyr Tyr 'Lys Leu Ser Gin Glu Leu 
1 5 



<210> 85 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 85 

Thr Tyr Thr Thr Asn Ser Gin Cys He 
1 5 



<210> 86 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 86 

Ser Phe Leu Val Pro Pro Met Thr He 
1 5 



<210> 87 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 87 

Tyr Tyr Val Asn Gin Ser Gly lie Val 
1 5 



<210> 88 
<211> 9 
<212> PRT 

<213> Homo sapiens 



<400> 88 

Leu Phe Asn Thr Thr Leu Thr Gly Leu 
1 5 
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<210> 89 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 89 

Leu Phe Gly Pro Cys He Phe Asn Leu 
1 5 



<210> 90 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 90 

Arg Trp Val Thr Pro Pro Thr Gin He 
1 5 



<210> 91 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 91 

Leu Pro Phe Leu Gly Pro Leu Ala Ala He 
15 10 



<210> 92 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 92 

Leu Pro Tyr His He Phe Leu Phe Thr Val 
15 10 



<210> 93 

<211> 10 

<212> PRT 

<213> Homo sapiens 



<400> 93 

Gly Ala Leu Gly Thr Gly He Gly Gly He 
15 10 
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<210> 94 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 94 

Leu Pro Phe Val He Gly Ala Giy Val Leu 
15 10 



<210> 95 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 95 

Arg Arg Pro Leu Asp Arg Pro Ala Ser 
1 5 



<210> 96 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 96 

Phe Arg Pro Tyr Val Ser He Pro Val 
1 5 



<210> 97 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 97 

Arg Arg Ala Leu Asd Leu Leu Thr Ala 
1 5 



<210> 98 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 98 

Trp Arg Met Gin Arg Pro Gly Asn He 
1 5 
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<210> 99 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 99 

Asp Arg He Gin Arg Arg Ala Glu Glu Leu 
15 10 



<210> 100 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 100 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
15 10 



<210> 101 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 101 

Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
15 10 



<210> 102 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 102 

Leu Phe Gly Pro Cys He Phe Asn Leu Leu 
15 10 



<210> 103 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 103 

Gin Phe Tyr Tyr Lys Leu Ser Gin Glu Leu 
15 10 
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<210> 104 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 104 

Gin Trp Met Pro Trp He Leu Pro Phe Leu 
15 10 



<210> 105 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 105 

Cys Tyr Tyr Val Asn Gin Ser Gly He Val 
15 10 



<210> 106 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 106 

Asn Phe Val Ser Ser Arg He Glu Ala Val 
15 10 



<210> 107 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 107 

Gly Pro Leu Val Ser Asn Leu Glu He 
1 5 



<210> 108 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 108 

Leu Pro Leu Asn Phe Arg Pro Tyr Val 
1 5 



WO 99/67395 
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<210> 109 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 109 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 110 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 110 

Glu Pro Lys Met Gin Ser Lys Thr Lys lie 
15 10 



<210> 111 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 111 

Leu Pro Tyr His He Phe Leu Phe Thr Val 
15 10 



<210> 112 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 112 

Arg Glu Lys His Val Lys Glu Val He 
1 5 



<210> 113 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 113 

Lys Pro Arg Asn Lys Arg Val Pro He Leu 
1 5 10 
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<210> 114 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 114 

Val Val Leu Gin Asn Arg Arg Ala Leu 
1 5 



<210> 115 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 115 

Ala Val Val Leu Gin Asn Arg Arg Ala Leu 
15 10 



<210> 116 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 116 

Leu Pro Phe Val lie Gly Ala Gly Val 
1 5 



<210> 117 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 117 

Asp Leu Tyr Ser Tyr Val lie Ser Lys 
1 5 



<210> 118 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 118 

Thr Glu Gin Asp Leu Tyr Ser Tyr Val lie 
15 10 
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*210> 119 
<211> 2615 
<212> ADN 

<213> Homo sapiens 
<400> 119 

gaattccggg aagccagacg gttaacacag acaaagtgct gccgtgacac tcggccctcc 60 
agtgttgcgg agaggcaaga gcagcgaccg cgcacctgtc cgcccggagc tgggacgcgc 120 
gcccgggcgg ccggacgaag cgaggaggga ccgccgaggc tgcccccaag tgtaactcca 180 
gcactgtgag gtttcaggga ttggcagagg ggaccaaggg gacatgaaaa tggacatgga 24 0 
ggatgcggat atgactctgt ggacagaggc tgagtttgaa gagaagtgta catacattgt 300 
gaacgaccac ccctgggatt ctggtgctga tggcggtact tcggttcagg cggaggcatc 360 
cttaccaagg aatctgcttt tcaagtatgc caccaacagt gaagaggtta ttggagtgat 4 20 
gagtaaagaa tacataccaa agggcacacg ttttggaccc ctaataggtg aaatctacac 480 
caatgacaca gttcctaaga acgccaacag gaaatatttt tggaggatct attccagagg 540 
ggagcttcac cacttcattg acggctttaa tgaagagaaa agcaactgga tgcgctatgt 600 
gaatccagca cactctcccc gggagcaaaa cctggctgcg tgtcagaacg ggatgaacat 660 
ctacttctac accattaagc ccatccctgc caaccaggaa cttcttgtgt ggtattgtcg 720 
ggactttgca gaaaggcttc actaccctta tcccggagag ctgacaatga tgaatctcac 780 
acaaacacag agcagtctaa agcaaccgag cactgagaaa aatgaactct gcccaaagaa 840 
tgtcccaaag agagagtaca gcgtgaaaga aatcctaaaa ttggactcca acccctccaa 900 
aggaaaggac ctctaccgtt ctaacatttc acccctcaca tcagaaaagg acctcgatga 960 
ctttagaaga cgtgggagcc ccgaaatgcc cttctaccct cgggtcgttt accccatccg 1020 
ggcccctctg ccagaagact ttttgaaagc ttccctggcc tacgggatcg agagacccac 1080 
gtacatcact cgctccccca ttccatcctc caccactcca agcccctctg caagaagcag 1140 
ccccgaccaa agcctcaaga gctccagccc tcacagcagc cctgggaata cggtgtcccc 1200 
tgtgggcccc ggctctcaag agcaccggga ctcctacgct tacttgaacg cgtcctacgg 1260 
cacggaaggt ttgggctcct accctggcta cgcacccctg ccccacctcc cgccagcttt 1320 
catcccctcg tacaacgctc actaccccaa gttcctcttg cccccctacg gcatgaattg 1380 
taatggcctg agcgctgtga gcagcatgaa tggcatcaac aactttggcc tcttcccgag 1440 
gctgtgccct gtctacagca atctcctcgg tgggggcagc ctgccccacc ccatgctcaa 1500 
ccccacttct ctcccgagct cgctgccctc agatggagcc cggaggttgc tccagccgga 1560 
gcatcccagg gaggtgcttg tcccggcgcc ccacagtgcc ttctccttta ccggggccgc 1620 
cgccagcatg aaggacaagg cctgtagccc cacaagcggg tctcccacgg cgggaacagc 1680 
cgccacggca gaacatgtgg tgcagcccaa agctacctca gcagcgatgg cagcccccag 1740 
cagcgacgaa gccatgaatc tcattaaaaa caaaagaaac atgaccggct acaagaccct 1800 
tccctacccg ctgaagaagc agaacggcaa gatcaagtac gaatgcaacg tttgcgccaa 1860 
gactttcggc cagctctcca atctgaaggt ccacctgaga gtgcacagtg gagaacggcc 1920 
tttcaaatgt cagacttgca acaagggctt tactcagctc gcccacctgc agaaacacta 1980 
cctggtacac acgggagaaa agccacatga atgccaggtc tgccacaaga gatttagcag 2040 
caccagcaat ctcaagaccc acctgcgact ccattctgga gagaaaccat accaatgcaa 2100 
ggtgtgccct gccaagttca cccagtttgt gcacctgaaa ctgcacaagc gtctgcacac 2160 
ccgggagcgg ccccacaagt gctcccagtg ccacaagaac tacatccatc tctgtagcct 2220 
caaggttcac ctgaaaggga actgcgctgc ggccccggcg cctgggctgc ccttggaaga 2280 
tctgacccga atcaatgaag aaatcgagaa gtttgacatc agtgacaatg ctgaccggct 2340 
cgaggacgtg gaggatgaca tcagtgtgat ctctgtagtg gagaaggaaa ttctggccgt 2400 
ggtcagaaaa gagaaagaag aaactggcct gaaagtgtct ttgcaaagaa acatggggaa 2460 
tggactcctc tcctcagggt gcagccttta tgagtcatca gatctacccc tcatgaagtt 2520 
gcctcccagc aacccactac ctctggtacc tgtaaaggtc aaacaagaaa cagttgaacc 2580 
aatggatcct taagattttc agaaaacact tattt 2615 



<210> 120 
<211> 29 
<212> PRT 

<213> Homo sapiens 
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<400> 120 

Leu Gin Asn Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly 
15 10 15 

Thr Cys Leu Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
20 25 



<210> 121 

<211> 21 

<212> ADN 

<213> Homo sapiens 

<400> 121 

cttcaaacaa caaccaggag g 21 



<210> 122 

<211> 20 

<212> ADN 

<213> Homo sapiens 



<400> 122 

ttggggaggt tggccgacga 



20 
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Box I Observations where certain claims were found unsearchable (Continuation of item 1 of first sheet) 

This international search report has not been established in respect of certain claims under Article 1 7(2)(a) forthe following reasons : 
1. I I Claims Nos.: 

' — ' because they relate to subject matter not required to be searched by this Authority, namely: 



2. [T| CiaimsNos.: 8 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 

See supplemetary sheet INFORMATION FOLLOW-UP PCT/ISA/210 

3. I I CiaimsNos.: 

1 — ' because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6 .4(a). 
Box D Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 
This International Searching Authority found multiple inventions in this international application, as follows: 

See supplementary sheet 



1 . I I As all required addiuonal search fees were timely paid by the applicant, this international search report covers all 
— searchable claims. 

2. fx] As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 

of any additional fee. 

3. I I As only some of the required additional search fees were timely paid by the applicant, this international search report 
' — ' covers only those claims for which fees were paid, specifically claims Nos.: 



4^ I — | No required additional search fees were timely paid by the applicant. Consequently, this international search report is 
' — I restricted to the invention first mentioned in the claims; it is covered by claims Nos. : 



Remark on Protest Q The addiuonal search fees were accompanied by the applicant 1 s protest. 

| | No protest accompanied the payment of additional search fees. 
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The International Searching Authority found several (groups of) inventions in 
the international application, namely: 

1. Claims: 1, 9, 21-23, 26 (wholly), 28, 10-20 and 27-37 (partly) 

Nucleic acid fragments derived from HERV-7q env, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

2. Claims: 2-7, 10-20, 27-37 (all partly) 

Nucleic acid fragments derived from HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

3. Claims: 2-7, 10-20, 27-37 (all partly) 

Human nucleic acid fragments similar to HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

4. Claims: 24, 25 

Compositions comprising a CKS-type motif, inasmuch as said compositions do 
not contain a sequence as per the first invention. 
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Claim No: 8 



Claim 8 concerns a very wide variety of compounds. A support basis as defined 
in PCT Article 6 and a description as defined in PCT Article 5 can however be 
found for only a very limited number of the claimed compounds. In the present 
case, the claims are so lacking in support basis and the disclosure of the 
invention in the description is so limited that it is impossible to carry out any 
significant search concerning the whole claimed spectrum. 

The applicant's attention is drawn to the fact that claims concerning inventions 
in respect of which no search report has been established need not be the subject 
of a preliminary examination report (PCT Rule 66.1 (e)). The applicant is 
warned that the guideline adopted by the EPO acting in its capacity as 
International Preliminary Examining Authority is not to proceed with a 
preliminary examination of a subject matter unless a search has been carried out 
thereon. This position will remain unchanged, notwithstanding that the claims 
have or have not been modified, either after receiving the search report, or 
during any procedure under Chaper II. 
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Comparez nucleotides 1-1462 de SEQ ID 






NO: 117 avec nucleotides 928-2390 de SEQ ID 






NO: 1 de la presente demande; comparez SEQ 






ID NO: 118 avec SEQ ID N0s:22 et 120 de la 






presente demande 
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Database Gen Bank. Sequence HSAC 000064 


1-4,13 




Clone humain BAC RG083M05 de 7q21-7q22, 






sequence complet. 17 novembre 1996. 






XP002118730 






Comparez nucleotides 28000-38500 d' 






AC00064 avec SEQ ID NO: 3 
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m 
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T" document publie avant la date de depot international, ma is 

poaterieurement a la date de priortte revendiquee 
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technique pertinent, mats cite pour oomprendre te princpe 
ou la theone constituant la base de ('Invention 

"X" document partteuHerement pertinent, rinven tlon revendiquee ne peut 
etre consideree comme nouvelle ou comme impUquant une acttvfte 
inventive par rapport au document considers isolement 

"Y" document partlcullerement pertinent: rinven tjon revendiquee 
ne peut etre consideree comme Implfquant une actlvlte inventive 
lorsque le document est asaocie a un ouplusieure autres 
documents de meme nature, cette ccmbtnaison etant evldente 
pour une peroonne du metier 

"A" document qui fal parti* de ta meme famJBe de brevets 



Date a taquelle la recherche Internationale a ete etf ecUvement achevee 

18 octobre 1999 


Date rf expedition du present rapport da recherche Intematlonale 
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C4«utto) OOCUMENTS CONSIDERES COM ME PERTINENTS 


CH6gori»* 


Mentfflcattan dra document* cite*, avee.le cas echetnt, rindlcatlondas pasugta prtlnant* 


no. des revencfcaitons vis6es 


X 


ALLIEL PH ET AL: "Sequences retrovlrales 

endogenes aniogues a celle du nouveau 

retrovirus HSRV assocle a la sclerose en 

plaques ( premiere partle)" 

COHPTES RENDUS DES SEANCES DE L'ACADEHIE 

DES SCIENCES SERIE III: SCIENCES DE LA 

VIE., 

vol. 321, no. 6, Ju1n 1998 (1998-06), 
pages 495-499, XP002101380 
HONTREUIL FR 
figures 2,3 


1,3-12, 
14-36 


Y 
A 


natabase GenBank Seauence AC X93499 
mRNA de H. sapiens pour la proteine rab7 
10 fevrier 1997 
XP002119234 

& VITELLI R ET AL: "Molecular cloning and 
exoression analysis of the human rab7 
6TP-ase complementary deoxyribonucleic 
add" 

BIOCHEMICAL AND BIOPHYSICAL RESEARCH 
COMMUNICATIONS, 

vol. 229, no. 3, 1996, pages 887-890, 
ORLANDO, FL US 


1-4 


X 


FR 2 737 500 A (BIO MERIEUX) 
7 fevrier 1997 (1997-02-07) 
cite dans la demande 
le document en entier 


1,3-12, 
14-36 


p y 
r , a 


UO 99 02666 A (BIO MERIEUX) 

21 janvler 1999 (1999-01-21) 

Comparez SEQ ID NOs 130, 117, 114 et 120 

avec SE0 ID NOs: 1-3 de cette demande et 

SEQ ID NO: 118 avec SEQ ID NOs : 22 et 120 de 

cette demande 


1,3-12, 
14-36 


P.X 


W0 99 02696 A (BIO MERIEUX ;BESEME 
FREDERIC (FR); BLOND JEAN LUC (FR); B0UT0N 
OLD 21 janvler 1999 (1999-01-21) 
Comparez SEQ ID NOs: 4, 5, 7, 9 et 11 avec 
SEQ ID NOs: 1-3 de cette demande. 


1,3-12, 
14-36 


P.X 


ALLIEL PM ET AL: "Retrovirus endogenes et 
sclerose en plaques. II. HERV-7q" 
COHPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE., 

vol. 321, no. 10, octobre 1998 (1998-10), 

pages 857-863, XP002101381 

HONTREUIL FR 

le document en entier 

-/-- 


1,3-12, 
14-36 



Fom&Jtfn PCT/ISAfcIO <«it» <* la d*nJ4n» tmJH) (Ju** *«Z) 



page 2 de 3 



RAPPORT DE RECHERCHE INTERNATIONALE 



Demo tntematfcnaie No 

PCT/FR 99/01513 



0(cutt») OOCUUENTS CONSIDERES COM ME PERTINENTS 



Categorta*! toentmc*tk>n dM documents cites, avccte ess Webcam. I' Indication des passages pertinents 



no. dss revancficatiora viseea 



P.X 



WO 99 26972 A (GENETICS INSTITUTE, INC. ) 
3 juin 1999 (1999-06-03) 
comparez SEQ ID N0:4 avec a. a. 131-668 de 
sequence 22 de cette deraande 

HITANI M ET AL: "Suppressive effect on 
polyclonal B-cell activation of a 
synthetic peptide homologous to a 
transmembrane component of oncogenic 
retrovirus" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 84, no. 1, Janvier 1987 (1987-01), 
pages 237-240, XP002118729 
WASHINGTON US 
cite dans la demande 
le document en entier 



1-4 



24,25 
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L ande ntemaiionafe n° 

PCT/FR 99/81513 



Cadre I Observations • lorsqu'H a ete estlme que certaines revindications ne pouvaJent pas fair* I'objet d'une rechercrM 
(suit* du point 1 de la premier*) feuille) 



Conform ement a lartide 1 7-2)a), certaines revendicaliora n'ont pas fad rotajet tfune recherche pour les motifa sutvants: 

1 . | | Les roverKficationa n°" 

as rapportant a un objet a regard duquel radnirestration n'eet pas tonus da precede/ a la recherche, 4 savoin 



Lea reveraications n°* 8 

ae rapportant a dea parties da ta demande intern ationaie qui rta rampliaaant pas suffisamment les conditions present es pour 
qu'une recherche significative putsso dtre effectuee, en particulier: 

voir feuille supplemental re SUITE OES RENSEIGNEMENTS PCT/ISA/218 



Las revendicattons n M 

sont das revenolcationa de pendant ea et ns sent pas red gees oonformement aux dispositions da la deuxieme et da la 
troisieme phrases de la regie 6.4.a). 



Cadra II Observations • lorsqu'll y a absence d'unlte de llnvention (suite du point 2 de la premiere feuille) 



L'administration chargee de la recherche intemationaJe a trouve plusieurs inventions dans la demande intemationale, a savor: 

voir feuille supplementaire 



1 . Comma toutes les taxes additionneiles ont ate payees dans les delais par le deposant, le present rapport da raoharehe 
' intemationale porta sur toutes las revendications pouvartt fairs i'objet dune recherche. 

2. Ix I Com me toutes les reoherches port ant sur lea revenalcations qui ay prataiant ont pu dtre eftectuees aans effort partioufter 

jusbfiant una taxe additionnelle, l'administration n'a soflicite le paiement d'auoune taxe de oette nature. 



□ Comme una partie seulement des taxes additionneiles demandees a ate payee dans les delais par la deposant, le present 
rapport de recherche intemationaJe ne porta que sur les revendioationa pour lesquelles les taxes ont eta payees, a savoir 
tea revenolcationa n m 



□ Aucune taxe addition nefle demandee n'a eta payee dans las delais par le deposant En consequence, ta present rapport 
de recherche intemationale ne porte qua sur llnvention rrterrtionnee an premier lieu dans les ravendicattons; efle est 
couverte par bs revendioationa n °" 



Remarque quant a la reserve [ [ Las taxes adtftibnnefles etaient eocompagnees dune reserve de la part du depoean 

j | Le paiement dea taxes additiortnelles n'atait assorti d'auoune reserve. 
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SUITE DES RENSEtGNEMENTS IN0IQUE3 SUR PCT/ISA/ 219 



Suite du cadre 1.2 

Re vend i cations nos.: 8 



Le revendi cation 8 presente a trait a une tr$s grande variete de 
composes. Un fondement au sens de L'Article 6 PCT et un expose au sens de 
1 'Article 5 PCT ne peut cependant etre trouve que pour un nombre tres 
restreint de ces composes revendi que s. Dans le cas present, les 
revendi cations manquent & un tel point de fondement et 1'expos§ de 
Tinvention dans la description est si limite q'une recherche 
significative couvrant tout le spectre revendique est impossible. 

L'attention du deposant est attiree sur le fait que les revendi cations, 
ou des parties de revendi cations, ayant trait aux inventions pour 
lesquelles aucun rapport de recherche n'a ete etabli ne peuvent faire 
obligatoirement l'objet d'un rapport preliminaire d'examen (RSgle 66.1(e) 
PCT). Le deposant est averti que la ligne de conduite adoptee par l'OEB 
agissant en qualite d' administration chargee de rexamen preliminaire 
international est, normal ement, de ne pas proceder a un examen 
preliminaire sur un sujet n'ayant pas fait l'objet d'une recherche. Cette 
attitude restera inchangee, independarrment du fait que les revendi cations 
aient ou n'aient pas ete modifiees, soit apres la reception du rapport de 
recherche, soit pendant une quelconque procedure sous le Chapitre II. 



Demands tntomrionato No. PCT/FR 99/01513 



SUITE DES RENSEIGNEMENTS INDfQUES SUR PCT/JSA/ 210 



L 1 administration chargee de la recherche Internationale a trouve 
plusieurs (groupes d') inventions dans la demande international, a 
savoir: 

1. revendi cations: 1, 9, 21-23, 26 (complet), 28, 
10-29 et 27-37 (partiel lenient) 



Fragments d'acide nucleique derive du HERV-7q env, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anticorps et 
animaux transgeniques correspondants. 



2. revendi cations: 2-7, 10-20, 27-37( tous partiel lement) 

Fragments d'acide nucleique derive du HERV-7q gag, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anticorps et 
animaux transgeniques correspondants. 



3. revendi cations: 2-7, 10-20, 27-37( tous partiellement) 

Fragments d'acide nucleique humaines similaires a HERV-7q 
(SEQ ID NOs: 4-21 et 61), reactifs de diagnostic, 
applications et kits diagnostiques, peptides, compositions 
et applications pharmaceutiques, anticorps et animaux 
transgeniques correspondants. 



4. revendi cations: 24, 25 

Compositions comprenant un motif de type CKS, dans la mesure 
ou ces compositions ne contiennent pas une sequence selon la 
premiere invention. 
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